當然,,具身智能目前也面臨著尚待突破的難題。一方面,,具身智能要通過與現(xiàn)實環(huán)境的互動來獲取智能,但即使一個理論上能夠完美感知周遭世界并進行無監(jiān)督學習的具身智能,,也面臨著學習效率受環(huán)境制約的問題,,對于當前零樣本學習能力尚不完備的具身智能來說,這將大大限制其發(fā)展速度,。另一方面,,以仿真環(huán)境為依托的具身智能雖然能夠藉由計算機仿真出的環(huán)境來進行非實時的高速訓練,但面臨著仿真環(huán)境無法完全“還原”現(xiàn)實世界的問題,,導致該智能體難以在現(xiàn)實環(huán)境中實用化,,也難以在短時間內(nèi)積累出如同大模型訓練語料庫那樣的大規(guī)模數(shù)據(jù)集。如何解決上述難題,,將是具身智能未來發(fā)展的關(guān)鍵,。
2024年3月,谷歌云前人工智能主管李飛飛創(chuàng)建了一家名為“世界實驗室”的初創(chuàng)公司,,主要從事開發(fā)一種能夠理解三維物理世界的AI模型,,被稱為“大世界模型”,。其基本用法是,,給定任意圖片或文字,AI能夠從中提取物體,,進而還原出一個完整的三維空間,。例如,如果把文學作品輸入該模型,,用戶們就可以進入J.K.羅琳在《哈利·波特》中描繪的對角巷,,或者劉慈欣描述的三日凌空的《三體》世界;把畫作輸入該模型,,你可以坐進梵高的《夜晚露天咖啡座》,,或者站在霍普的《夜游者》酒吧門口,如同一個等待進入的顧客,。
與此前廣泛應用于數(shù)字媒體制作的“2D轉(zhuǎn)3D”工具不同,,使用“大世界模型”,用戶不僅能夠在該空間內(nèi)水平移動,,還可以進行縱深移動和視角轉(zhuǎn)換,從不同角度看到物體的全貌,,并且這些物體還具備真實世界里的部分物理學特征,,包括受阻、碰撞,、透視關(guān)系等,。李飛飛將這種具備認識和理解空間能力的AI稱為“空間智能”,。
對于一個成立不久的公司,以上還只是早期的演示內(nèi)容,,但僅僅依靠這樣的演示內(nèi)容,,該公司便已拿到了2.3億美元的風險投資,,四個月后估值就超過了10億美元,。“大世界模型”之所以引發(fā)關(guān)注,,在于其直接面對了當前人工智能的一個關(guān)鍵難點:如何令AI認識和理解世界,?其與Sora等圖文生視頻類AI最大的不同點,,也在于此。體驗過此類AI應用的人或多或少都遇到過這樣的情況:人工智能生成的內(nèi)容完全不符合現(xiàn)實生活中的經(jīng)驗,,其結(jié)果或是令人啼笑皆非,,或是干脆成了“恐怖片”。這便是人工智能沒有認識和理解世界的結(jié)果,,其所做的僅僅是預測每個像素點的數(shù)值,。
當前,智能體研究的兩大領(lǐng)域——強化學習與機器人——都在關(guān)注如何形成一個足夠準確的“世界模型”,。這也是楊·勒丘恩等人工智能領(lǐng)域泰斗級學者都在反復強調(diào)的,,只有解決了構(gòu)建世界模型的問題,才能真正突破人工智能的訓練瓶頸,。屆時,,人工智能能夠利用世界模型中的狀態(tài)表征和動作表征數(shù)據(jù)進行反復試錯,進而找到現(xiàn)實世界問題的解決方案,。盡管當前距離這一目標還比較遙遠,,但李飛飛的“大世界模型”或許可以看作朝向這一人工智能解決方案邁出了一小步。
國務院新聞辦將于今天(17日)上午10時舉行新聞發(fā)布會,,國家統(tǒng)計局相關(guān)負責人將介紹2024年國民經(jīng)濟運行情況,并答記者問,。
2025-01-17 10:43:44重磅經(jīng)濟數(shù)據(jù)將公布1月14日,2025年春運開啟幸?;丶衣飞?,許多人正在奔向闊別已久的故鄉(xiāng)中國人的中國年要來啦條條歸途,暖意涌動2025年春運是中國春節(jié)申遺成功后首個春運
2025-01-14 08:16:222025年春運