DeepSeek獨(dú)立發(fā)現(xiàn)o1的一些核心思路低成本高性能引熱議

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-02-01 09:07:48 機(jī)器之心Pro

春節(jié)期間,，國內(nèi)外AI圈都被DeepSeek刷屏。英偉達(dá)的股市震蕩更是讓全世界矚目,。DeepSeek最近發(fā)布的兩個(gè)模型——DeepSeek-V3和DeepSeek-R1以較低成本獲得了與OpenAI同類模型相當(dāng)?shù)男阅?，這引發(fā)了市場(chǎng)對(duì)AI硬件需求的擔(dān)憂，投資者擔(dān)心未來對(duì)英偉達(dá)高端芯片的需求可能會(huì)減少,。

關(guān)于DeepSeek技術(shù)創(chuàng)新的討論也非常多,。很多人認(rèn)為，DeepSeek在硬件受限的情況下走出了一條不同于OpenAI等狂堆算力的道路,，通過一系列技術(shù)創(chuàng)新來減少模型對(duì)算力的需求,，同時(shí)提升性能。這些成就得到了包括Sam Altman在內(nèi)的AI領(lǐng)軍人物的認(rèn)可,。

隨后,，OpenAI首席研究官M(fèi)ark Chen發(fā)帖表示，DeepSeek確實(shí)獨(dú)立發(fā)現(xiàn)了一些OpenAI也在用的核心理念,，但這不代表OpenAI在算力上的高投入不合理,。他認(rèn)為外界對(duì)成本方面的反應(yīng)有些過度夸大，并指出擁有預(yù)訓(xùn)練和推理兩個(gè)范式意味著可以在兩個(gè)維度上優(yōu)化能力,。隨著蒸餾研究的成熟,，降低成本和提升能力愈發(fā)解耦。OpenAI將繼續(xù)提升低成本提供模型服務(wù)的能力,，但也會(huì)繼續(xù)專注于其研究路線圖,，計(jì)劃在今年帶來更多更好的模型。

OpenAI研究科學(xué)家Noam Brown也試圖弱化外界對(duì)OpenAI和DeepSeek的對(duì)比,，但效果并不明顯,。Mark Chen提到的“外界對(duì)成本方面的反應(yīng)有些過度夸大”這一點(diǎn)也被廣泛討論,。實(shí)際上，DeepSeek-V3的成本僅包括正式訓(xùn)練,，不包括前期研究,、消融實(shí)驗(yàn)等費(fèi)用。

圖靈獎(jiǎng)得主,、Meta AI首席科學(xué)家Yann LeCun認(rèn)為市場(chǎng)對(duì)于DeepSeek的成本反應(yīng)并不合理,。他指出，巨額投資主要用于維持AI服務(wù)穩(wěn)定運(yùn)行,，而不是僅僅用于訓(xùn)練模型,。隨著AI能力增強(qiáng)，維持服務(wù)運(yùn)行的成本會(huì)更高,，關(guān)鍵在于用戶是否愿意為這些增強(qiáng)的功能付費(fèi),。

不少網(wǎng)友贊同LeCun的觀點(diǎn)，認(rèn)為訓(xùn)練和推理成本更低的AI技術(shù)能更快普及,，從而創(chuàng)造更大的市場(chǎng),。從這個(gè)角度來看，DeepSeek在降低推理成本方面的努力似乎比降低訓(xùn)練成本更為重要,。

面對(duì)可能即將到來的推理需求激增,，OpenAI、Meta等公司都在做相應(yīng)準(zhǔn)備,，如OpenAI的“星際之門”項(xiàng)目和Meta的新一年600億美元的AI投資。2025年,，AI市場(chǎng)的競(jìng)爭(zhēng)依然激烈,，DeepSeek在新一年的發(fā)展值得關(guān)注。

(責(zé)任編輯：張蕾)

關(guān)閉

DeepSeek獨(dú)立發(fā)現(xiàn)o1的一些核心思路 低成本高性能引熱議

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek獨(dú)立發(fā)現(xiàn)o1的一些核心思路低成本高性能引熱議