圖森未來(lái)正式發(fā)布圖生視頻大模型“Ruyi” 推動(dòng)創(chuàng)作新變革

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-12-17 11:28:49 搜狐網(wǎng)

圖森未來(lái)正式發(fā)布圖生視頻大模型Ruyi。12月17日,，圖森未來(lái)發(fā)布了其圖像生成大模型“Ruyi”，引起業(yè)界廣泛關(guān)注,。該模型專為消費(fèi)級(jí)顯卡優(yōu)化,，用戶可以通過(guò)huggingface平臺(tái)下載開(kāi)源版本Ruyi-Mini-7B,。這一發(fā)布標(biāo)志著圖像生成技術(shù)的重大進(jìn)步,，為AI創(chuàng)作者提供了便捷和高質(zhì)量的工具,，推動(dòng)了智能設(shè)備領(lǐng)域的創(chuàng)新發(fā)展。

Ruyi支持從384x384到1024x1024的分辨率,，用戶可根據(jù)需要調(diào)整視頻長(zhǎng)寬比,，最長(zhǎng)可生成120幀/5秒的視頻。此外,，Ruyi允許用戶設(shè)置最多5個(gè)起始幀和5個(gè)結(jié)束幀,，通過(guò)循環(huán)疊加實(shí)現(xiàn)無(wú)限長(zhǎng)度的視頻生成。模型還提供四檔運(yùn)動(dòng)幅度控制,，用戶能精確把控畫(huà)面變化程度。在鏡頭控制方面,，Ruyi能滿足多種需求,，包括上,、下,、左,、右及靜止的鏡頭角度，極大豐富了創(chuàng)作空間,。

該技術(shù)基于DiT架構(gòu)，包含CasualVAE模塊和DiffusionTransformer模塊,。CasualVAE模塊負(fù)責(zé)視頻數(shù)據(jù)的高效壓縮與解壓縮,，而DiffusionTransformer則在壓縮后生成高質(zhì)量視頻。Ruyi模型總參數(shù)量達(dá)7.1億,，使用了約200M視頻片段進(jìn)行訓(xùn)練,，顯示出其在視頻生成領(lǐng)域的強(qiáng)大能力和潛力,。這項(xiàng)技術(shù)將使影視制作人,、內(nèi)容創(chuàng)作者和設(shè)計(jì)師享受到更高效便捷的體驗(yàn)。

在實(shí)際應(yīng)用中,，Ruyi為游戲,、視頻制作、日常社交平臺(tái)等領(lǐng)域提供了新的可能性,。通過(guò)靈活的參數(shù)設(shè)置和高效的處理能力,，創(chuàng)作者可以快速生成內(nèi)容，提升生產(chǎn)效率,，甚至實(shí)現(xiàn)高質(zhì)量的實(shí)時(shí)渲染,。這對(duì)需要大量視頻素材的行業(yè)尤其有吸引力,。在競(jìng)爭(zhēng)激烈的智能設(shè)備市場(chǎng)上，Ruyi的發(fā)布吸引了眾多創(chuàng)作者的關(guān)注,，成為AI圖像生成領(lǐng)域的重要選擇,。

盡管功能強(qiáng)大，Ruyi目前仍存在一些不足之處,，如手部畸形,、多人物時(shí)面部細(xì)節(jié)崩壞及不可控的轉(zhuǎn)場(chǎng)效果等。這表明未來(lái)還需進(jìn)一步改進(jìn)模型,，增強(qiáng)其實(shí)用性和兼容性,。隨著不斷更新和完善，Ruyi將越來(lái)越符合市場(chǎng)需求,，并提升用戶體驗(yàn),。

Ruyi的推出使其在視頻生成技術(shù)的競(jìng)爭(zhēng)中占得先機(jī)，與Adobe,、NVIDIA等行業(yè)巨頭形成有效競(jìng)爭(zhēng),。技術(shù)的開(kāi)源模式讓更多的開(kāi)發(fā)者和愛(ài)好者參與迭代，推動(dòng)AI創(chuàng)作的普及,。越來(lái)越多的創(chuàng)作者開(kāi)始利用這一先進(jìn)技術(shù)進(jìn)行個(gè)性化創(chuàng)作,，對(duì)內(nèi)容生產(chǎn)的形態(tài)產(chǎn)生深遠(yuǎn)影響。

圖森未來(lái)的Ruyi大模型為視頻內(nèi)容創(chuàng)作開(kāi)啟了新的大門(mén),，其技術(shù)進(jìn)步和市場(chǎng)反響顯著,。未來(lái)，行業(yè)將更加關(guān)注這類技術(shù)的發(fā)展及其應(yīng)用,，特別是在創(chuàng)作效率和質(zhì)量上,，Ruyi有潛力引領(lǐng)行業(yè)變革。對(duì)于有意嘗試這一創(chuàng)新工具的創(chuàng)作者來(lái)說(shuō),，Ruyi的開(kāi)源特性為他們提供了一個(gè)良好的起點(diǎn),，鼓勵(lì)更多創(chuàng)意思維的誕生。

(責(zé)任編輯：盧其龍 CN070)

關(guān)閉

圖森未來(lái)正式發(fā)布圖生視頻大模型“Ruyi” 推動(dòng)創(chuàng)作新變革

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)