北京時(shí)間2月25日晚間,阿里巴巴宣布全面開(kāi)源旗下視頻生成模型萬(wàn)相2.1,,這一消息迅速點(diǎn)燃了整個(gè)AI領(lǐng)域,,預(yù)示著AI驅(qū)動(dòng)的視頻創(chuàng)作即將進(jìn)入一個(gè)全新時(shí)代。
在當(dāng)前AI產(chǎn)業(yè)競(jìng)爭(zhēng)激烈的背景下,,阿里巴巴的這一舉動(dòng)格外引人注目,。本周內(nèi),美國(guó)Anthropic公司發(fā)布了混合推理模型Claude 3.7 Sonnet,,DeepSeek持續(xù)開(kāi)源了5個(gè)代碼庫(kù),,xAI也在忙于推出“最強(qiáng)大模型”并進(jìn)行應(yīng)用優(yōu)化,亞馬遜則計(jì)劃為語(yǔ)音助手Alexa帶來(lái)“AI升級(jí)”,,甚至有傳言稱OpenAI可能推出GPT-4.5,。阿里巴巴選擇此時(shí)開(kāi)源萬(wàn)相2.1,無(wú)疑在這場(chǎng)競(jìng)爭(zhēng)中投下了一枚重磅炸彈,。
此次開(kāi)源的萬(wàn)相2.1模型采用Apache 2.0協(xié)議,,將14B和1.3B兩個(gè)參數(shù)規(guī)格的全部推理代碼和權(quán)重開(kāi)放給全球開(kāi)發(fā)者,支持文生視頻和圖生視頻任務(wù),可在Github,、HuggingFace和魔搭社區(qū)下載體驗(yàn),。這標(biāo)志著視頻生成領(lǐng)域?qū)⒂瓉?lái)重大發(fā)展。
萬(wàn)相2.1在VBench基準(zhǔn)測(cè)試中以86.22%的總分力壓美圖奇想,、OpenAI Sora,、Adobe/麻省理工的CausVid、蘋(píng)果STIV等國(guó)內(nèi)外競(jìng)品,,穩(wěn)居全球第一,。該模型能夠精準(zhǔn)展現(xiàn)復(fù)雜穩(wěn)定的人物肢體動(dòng)作,如旋轉(zhuǎn),、跳躍,、轉(zhuǎn)身、翻滾等,,并能逼真還原碰撞、反彈,、切割,、擠壓等物理場(chǎng)景,大幅提升了AI生成視頻的真實(shí)性,。此外,,萬(wàn)相2.1還具備獨(dú)特的文字生成能力,可以直接通過(guò)提示詞在視頻中生成中文字及特殊藝術(shù)效果,。
14B版本適用于專業(yè)創(chuàng)作者,,滿足高質(zhì)量、高要求的創(chuàng)作需求,;而1.3B參數(shù)量版本則更為親民,,僅需家用顯卡(如英偉達(dá)4090)單卡8.2G顯存即可生成480P高質(zhì)量視頻,性能堪比某些5B參數(shù)量的閉源大模型,,普通用戶也能輕松上手,。
萬(wàn)相2.1的應(yīng)用場(chǎng)景廣泛。游戲開(kāi)發(fā)者可以利用它生成動(dòng)畫(huà)和特效,,提升玩家體驗(yàn),;廣告主能制作更具吸引力的廣告視頻;教師可以制作生動(dòng)的教學(xué)視頻,,使知識(shí)傳遞更形象,;短視頻創(chuàng)作者則能高效生成高質(zhì)量?jī)?nèi)容,在競(jìng)爭(zhēng)中脫穎而出,。
阿里巴巴萬(wàn)相2.1的開(kāi)源為整個(gè)視頻生成模型賽道注入了新的活力,,讓這個(gè)領(lǐng)域更加生機(jī)勃勃。對(duì)于OpenAI、谷歌等競(jìng)爭(zhēng)對(duì)手來(lái)說(shuō),,這意味著巨大的挑戰(zhàn),,尤其是在AI視頻定價(jià)方面。而對(duì)于消費(fèi)者和內(nèi)容產(chǎn)業(yè)從業(yè)者,,這將顯著降低創(chuàng)作視頻的成本和門(mén)檻,,人人都有機(jī)會(huì)成為視頻創(chuàng)作者。隨著萬(wàn)相2.1在中文AI應(yīng)用市場(chǎng)掀起新玩法升級(jí)的浪潮,,整個(gè)AI視頻創(chuàng)作領(lǐng)域?qū)⒂瓉?lái)前所未有的變革,。