眼下最受關(guān)注的AI新星、DeepSeek創(chuàng)始人梁文鋒正與張一鳴背道而馳。1月28日,,DeepSeek發(fā)布了新一代多模態(tài)大模型Janus-Pro,,分為70億和15億參數(shù)量?jī)蓚€(gè)版本,并且均為開源,。發(fā)布后不久,,該模型便登上了知名AI開源社區(qū)Hugging Face的熱門榜前列。
相比去年11月發(fā)布的JanusFlow,,Janus-Pro優(yōu)化了訓(xùn)練策略,、擴(kuò)展了訓(xùn)練數(shù)據(jù),模型更大,,在多模態(tài)理解和文本到圖像的指令跟蹤功能方面取得重大進(jìn)步,,同時(shí)增強(qiáng)了文本到圖像生成的穩(wěn)定性。根據(jù)DeepSeek的測(cè)試結(jié)果,,這款文生圖大模型在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)出色,,甚至強(qiáng)于OpenAI旗下的DALL-E 3以及Stable Diffusion。盡管用戶指出Janus-Pro并不全面超越DALL-E 3,,但其以較小的參數(shù)量展現(xiàn)了不俗潛力,。
本月早些時(shí)候,,DeepSeek還發(fā)布了R1大模型。作為一款開源模型,,R1在數(shù)學(xué),、代碼、自然語(yǔ)言推理等任務(wù)上的性能號(hào)稱可以比肩OpenAI當(dāng)前最強(qiáng)的o1模型正式版,。更重要的是,,DeepSeek僅花費(fèi)了相當(dāng)于OpenAI零頭的資金和資源,就拿出了堪與o1比肩的產(chǎn)品,。這表明“小力出奇跡”的策略在DeepSeek身上屢試不爽,。
這種低成本高效率的做法對(duì)行業(yè)產(chǎn)生了沖擊。例如,,1月27日美股交易中,,英偉達(dá)股價(jià)暴跌17%,市值蒸發(fā)約4.3萬(wàn)億人民幣,。然而,,長(zhǎng)期來(lái)看,芯片依然是AI大模型發(fā)展的基石,,英偉達(dá)作為這一領(lǐng)域技術(shù)壁壘最堅(jiān)固的公司,,其“賣鏟者”的長(zhǎng)期價(jià)值依然堅(jiān)挺。
字節(jié)跳動(dòng)自2023年進(jìn)軍AI大模型以來(lái),,投入大量資金和資源,,快速擴(kuò)充AI業(yè)務(wù)矩陣,發(fā)布十幾款大模型及十幾個(gè)AI應(yīng)用,。盡管如此,,“小力出奇跡”的DeepSeek讓字節(jié)看似無(wú)可置疑的“大力”打法遭遇挑戰(zhàn)。DeepSeek不僅在AI技術(shù)和產(chǎn)品上打破了舊思維,,也在不經(jīng)意間點(diǎn)破了“大力出奇跡”并非放諸四海皆準(zhǔn)的商業(yè)真理,。
Janus-Pro的成本相對(duì)較低,使用輕量級(jí)分布式訓(xùn)練框架,,1.5B參數(shù)模型大約需要128張英偉達(dá)A100芯片訓(xùn)練7天,,7B參數(shù)模型則需要256張A100芯片和14天訓(xùn)練時(shí)間。這樣計(jì)算下來(lái),,模型訓(xùn)練成本可低至數(shù)萬(wàn)美元,。性能方面,Janus-Pro通過將多模態(tài)理解和生成統(tǒng)一起來(lái),,提升了視覺編碼解耦的能力,。在實(shí)際應(yīng)用中,無(wú)論是文生圖還是圖生文,,Janus-Pro都表現(xiàn)良好,。
Janus-Pro繼承了DeepSeek的開源傳統(tǒng),,使用MIT協(xié)議,個(gè)人和中小企業(yè)可以省去不少費(fèi)用,。此外,,由于模型體量小,Janus-Pro可以在PC端安裝并本地運(yùn)行,,進(jìn)一步降低了使用成本,。
相比之下,國(guó)外秉持“大力出奇跡”的OpenAI近期遇到一些問題,。例如,,其文生視頻大模型Sora雖然震撼亮相,但隨后效果不盡如人意,,被谷歌等競(jìng)爭(zhēng)對(duì)手抓住機(jī)會(huì)嘲諷,。盡管如此,OpenAI仍堅(jiān)持堆芯片,、堆算力的路線,,計(jì)劃未來(lái)四年投資5000億美元用于AI基礎(chǔ)設(shè)施。
字節(jié)跳動(dòng)的核心產(chǎn)品豆包大模型在知識(shí),、代碼,、推理等多項(xiàng)公開測(cè)評(píng)基準(zhǔn)上得分優(yōu)于GPT-4o和DeepSeek-V3,但其投入同樣驚人,。據(jù)傳今年將投入超過120億美元用于AI基礎(chǔ)設(shè)施,,不過字節(jié)對(duì)此回應(yīng)稱相關(guān)消息并不準(zhǔn)確。
DeepSeek通過“小力出奇跡”的方式展示了新的技術(shù)路線和商業(yè)哲學(xué),,打破了傳統(tǒng)的大廠主導(dǎo)邏輯,。這表明中小廠商完全可以用更少的資源做出更好的產(chǎn)品,從而得到市場(chǎng)和投資者的認(rèn)可,。
在科技領(lǐng)域風(fēng)起云涌的今天,,一家名為DeepSeek的AI公司突然成為了全球關(guān)注的焦點(diǎn)
2025-02-11 14:32:25DeepSeek梁文鋒身家暴漲