Sora是基于過(guò)去對(duì)DALL·E和GPT的研究基礎(chǔ)構(gòu)建,,利用DALL·E 3的重述提示詞技術(shù),,為視覺(jué)模型訓(xùn)練數(shù)據(jù)生成高描述性的標(biāo)注,因此模型能更好的遵循文本指令,。
一位YouTube博主Paddy Galloway發(fā)表了對(duì)Sora的感想,,他表示內(nèi)容創(chuàng)作行業(yè)已經(jīng)永遠(yuǎn)的改變了,并且毫不夸張,?!拔疫M(jìn)入YouTube世界已經(jīng)15年時(shí)間,,但OpenAI剛剛的展示讓我無(wú)言…動(dòng)畫師/3D藝術(shù)家們有麻煩了,,素材網(wǎng)站將變得無(wú)關(guān)緊要,,任何人都可以無(wú)壁壘獲得難以置信的產(chǎn)品,,內(nèi)容背后的‘想法’和故事將變得更加重要,?!?/p>
但Sora模型當(dāng)前也存在弱點(diǎn),。OpenAI稱它可能難以準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理原理,,并且可能無(wú)法理解因果關(guān)系,。例如,一個(gè)人可能咬了一口餅干后,,餅干會(huì)沒(méi)有咬痕,,玻璃破碎的物理過(guò)程可能也無(wú)法被準(zhǔn)確呈現(xiàn),。
在周二凌晨1點(diǎn)的春季發(fā)布會(huì)上,OpenAI繼“文生視頻模型”Sora后再次為市場(chǎng)帶來(lái)新驚喜
2024-05-14 09:07:05OpenAI新模型:圖文音頻全搞定