12月25日,,阿里云發(fā)布了業(yè)界首個(gè)開源多模態(tài)推理模型QVQ-72B-Preview,。該模型在視覺理解和推理能力方面表現(xiàn)出色,特別是在解決數(shù)學(xué),、物理,、科學(xué)等領(lǐng)域的復(fù)雜問題上尤為突出,。多項(xiàng)評(píng)測(cè)數(shù)據(jù)顯示,,QVQ的表現(xiàn)超越了此前的視覺理解模型Qwen2-VL,,與OpenAI o1、Claude3.5 Sonnet等推理模型相當(dāng),。目前,,開發(fā)者可以在魔搭社區(qū)和HuggingFace平臺(tái)上直接體驗(yàn)這一模型。
人類的推理能力源于語(yǔ)言思維和視覺記憶,,因此利用視覺理解增強(qiáng)大模型的推理能力成為AI技術(shù)的重要探索方向。阿里云表示,,QVQ是一個(gè)基于視覺進(jìn)行深度思考和推理的大模型,。它不僅能更準(zhǔn)確地感知視覺內(nèi)容并進(jìn)行細(xì)致分析,,還會(huì)質(zhì)疑自身假設(shè),仔細(xì)審視推理過程中的每一步,,最終給出深思熟慮后的結(jié)論,。QVQ可以輕松識(shí)別“梗圖”內(nèi)涵,通過真實(shí)照片合理推斷物體數(shù)量及高度等信息,,并在面對(duì)數(shù)學(xué),、物理、化學(xué)等科學(xué)難題時(shí),,像人甚至科學(xué)家一樣提供思考過程和準(zhǔn)確答案,。
執(zhí)掌阿里云一周年,吳泳銘終于登上了2024年云棲大會(huì)的演講臺(tái),,他表示,,過去22個(gè)月,AI發(fā)展的速度超過任何歷史時(shí)期,。
2024-09-20 14:48:09阿里CEO吳泳銘稱阿里云將繼續(xù)降價(jià)當(dāng)?shù)貢r(shí)間12月11日,,谷歌CEO桑達(dá)爾·皮查伊發(fā)布了一份說明,宣布推出Gemini 2.0,,這是他們最強(qiáng)大的模型
2024-12-12 07:52:45谷歌AI大模型Gemini2.0發(fā)布