在過去一周里,,Sora成為了全球關(guān)注的熱點(diǎn),其熱議程度超越了ChatGPT,,盡管它還未向公眾全面開放,。Sora的出現(xiàn)不僅展示了視覺沖擊力超越文字的力量,也引發(fā)了人們對(duì)于AI發(fā)展深一層的思考:在2024年,,以Sora為代表的生成式AI或?qū)⒁I(lǐng)我們邁向更加不可思議的未來,。
不同于單純的視頻生成工具,Sora被視作一種“世界模型”,。盡管AI生成視頻并非新技術(shù),,但Sora在視頻的長度與質(zhì)量上實(shí)現(xiàn)了飛躍,超越了現(xiàn)有的文生視頻模型,,如Runway,、Stability AI的產(chǎn)品,,以及曾經(jīng)引起轟動(dòng)的Pika,。
Sora的技術(shù)實(shí)力體現(xiàn)在六個(gè)關(guān)鍵方面: - 根據(jù)文本生成長達(dá)60秒的高質(zhì)量視頻,忠實(shí)地呈現(xiàn)用戶指令,。 - 能夠生成包含復(fù)雜場(chǎng)景,、角色互動(dòng)、特定運(yùn)動(dòng)及精細(xì)背景的視頻,,增強(qiáng)敘事的真實(shí)感,。 - 深入理解語言,準(zhǔn)確把握提示內(nèi)容的情感,,使生成內(nèi)容緊密貼合指令,。 - 支持單個(gè)視頻中多個(gè)鏡頭的創(chuàng)作,保持風(fēng)格統(tǒng)一,,適用于多視角展示,。 - 能夠基于靜態(tài)圖像生成動(dòng)態(tài)視頻,,或擴(kuò)展已有視頻內(nèi)容。 - 模擬物理世界運(yùn)動(dòng),,包括物體移動(dòng),、相互作用等,體現(xiàn)了對(duì)現(xiàn)實(shí)世界的理解,。
OpenAI在介紹Sora時(shí),,特別強(qiáng)調(diào)其“世界模型”的特性,這在以往模型發(fā)布中是首次,。然而,,這一提法也引起了科技界的廣泛討論,特別是圍繞Sora是否真正理解物理世界,,以及“世界模型”的確切含義,。
一些專家,如英偉達(dá)的Jim Fan,,認(rèn)為Sora是一個(gè)可學(xué)習(xí)的物理模擬器,,即“世界模型”。但圖靈獎(jiǎng)得主楊立昆則指出,,僅憑生成逼真視頻并不意味著理解物理世界,,強(qiáng)調(diào)真正的“世界模型”應(yīng)具備基于當(dāng)前狀態(tài)預(yù)測(cè)未來狀態(tài)的能力,而Sora目前的自回歸生成方式尚不足以完全達(dá)到這一標(biāo)準(zhǔn),。
Sora雖在文生視頻領(lǐng)域樹立了新的里程碑,,但仍面臨挑戰(zhàn),如物理交互模擬不精確,、對(duì)象狀態(tài)變化處理不當(dāng),、長視頻連貫性不足及對(duì)象突兀出現(xiàn)等問題,顯示出在穩(wěn)定模擬物理世界方面的局限,。
整體而言,,盡管AI視頻生成技術(shù)在2023年取得顯著進(jìn)步,但仍未完全解決場(chǎng)景控制,、時(shí)間連貫性和視頻長度等核心問題,。Sora的問世激發(fā)了人們對(duì)AI視頻未來的無限遐想,同時(shí)也提示我們,,如同牛頓之前的物理學(xué),,AI領(lǐng)域仍有許多基礎(chǔ)科學(xué)問題等待破解。頂尖學(xué)者們,,如李飛飛與吳恩達(dá),,均認(rèn)為AI研究正處于一個(gè)類似“前牛頓時(shí)期”,強(qiáng)調(diào)智能科學(xué)的深層次探索與理論構(gòu)建的迫切性,。
隨著Sora的發(fā)布,,人們對(duì)于生成式AI的潛力抱持樂觀態(tài)度,,期待著未來AI能夠像人類一樣觀察、感知并理解這個(gè)世界,。這不僅是技術(shù)的飛躍,,更是對(duì)人類智能科學(xué)邊界的拓展,預(yù)示著一個(gè)激動(dòng)人心的未來正逐步臨近,。
6月20日,一場(chǎng)以“樓市新引力”為主題的論壇在北京成功召開,吸引了二十多家房地產(chǎn)行業(yè)企業(yè)的市場(chǎng)與品牌代表參與
2024-06-24 14:59:23貝殼邢巖:消費(fèi)者買房決策周期延長在遙遠(yuǎn)的未來,,地球會(huì)怎樣,,取決于我們今天的選擇。地球是全人類賴以生存的唯一家園,。珍愛地球,,人與自然和諧共生。
2024-04-22 15:49:19AI科幻大片丨珍AI地球