眼下最受關(guān)注的AI新星,、DeepSeek創(chuàng)始人梁文鋒正與張一鳴背道而馳,。1月28日,,DeepSeek發(fā)布了新一代多模態(tài)大模型Janus-Pro,,分為70億和15億參數(shù)量?jī)蓚€(gè)版本,并且均為開源,。發(fā)布后不久,該模型便登上了知名AI開源社區(qū)Hugging Face的熱門榜前列。
相比去年11月發(fā)布的JanusFlow,,Janus-Pro優(yōu)化了訓(xùn)練策略、擴(kuò)展了訓(xùn)練數(shù)據(jù),,模型更大,,在多模態(tài)理解和文本到圖像的指令跟蹤功能方面取得重大進(jìn)步,,同時(shí)增強(qiáng)了文本到圖像生成的穩(wěn)定性。根據(jù)DeepSeek的測(cè)試結(jié)果,,這款文生圖大模型在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)出色,,甚至強(qiáng)于OpenAI旗下的DALL-E 3以及Stable Diffusion。盡管用戶指出Janus-Pro并不全面超越DALL-E 3,,但其以較小的參數(shù)量展現(xiàn)了不俗潛力,。
本月早些時(shí)候,DeepSeek還發(fā)布了R1大模型,。作為一款開源模型,,R1在數(shù)學(xué)、代碼,、自然語(yǔ)言推理等任務(wù)上的性能號(hào)稱可以比肩OpenAI當(dāng)前最強(qiáng)的o1模型正式版,。更重要的是,DeepSeek僅花費(fèi)了相當(dāng)于OpenAI零頭的資金和資源,,就拿出了堪與o1比肩的產(chǎn)品,。這表明“小力出奇跡”的策略在DeepSeek身上屢試不爽。
這種低成本高效率的做法對(duì)行業(yè)產(chǎn)生了沖擊,。例如,,1月27日美股交易中,英偉達(dá)股價(jià)暴跌17%,,市值蒸發(fā)約4.3萬(wàn)億人民幣,。然而,長(zhǎng)期來看,,芯片依然是AI大模型發(fā)展的基石,,英偉達(dá)作為這一領(lǐng)域技術(shù)壁壘最堅(jiān)固的公司,,其“賣鏟者”的長(zhǎng)期價(jià)值依然堅(jiān)挺,。
三年過去,,字節(jié)和李子柒的關(guān)系依舊密切,。
2024-11-13 16:28:50張一鳴