春節(jié)期間,國(guó)內(nèi)外AI圈都被DeepSeek刷屏,。英偉達(dá)的股市震蕩更是讓全世界矚目,。DeepSeek最近發(fā)布的兩個(gè)模型——DeepSeek-V3和DeepSeek-R1以較低成本獲得了與OpenAI同類(lèi)模型相當(dāng)?shù)男阅?,這引發(fā)了市場(chǎng)對(duì)AI硬件需求的擔(dān)憂(yōu),,投資者擔(dān)心未來(lái)對(duì)英偉達(dá)高端芯片的需求可能會(huì)減少,。
關(guān)于DeepSeek技術(shù)創(chuàng)新的討論也非常多,。很多人認(rèn)為,,DeepSeek在硬件受限的情況下走出了一條不同于OpenAI等狂堆算力的道路,,通過(guò)一系列技術(shù)創(chuàng)新來(lái)減少模型對(duì)算力的需求,同時(shí)提升性能,。這些成就得到了包括Sam Altman在內(nèi)的AI領(lǐng)軍人物的認(rèn)可,。
隨后,OpenAI首席研究官M(fèi)ark Chen發(fā)帖表示,,DeepSeek確實(shí)獨(dú)立發(fā)現(xiàn)了一些OpenAI也在用的核心理念,,但這不代表OpenAI在算力上的高投入不合理。他認(rèn)為外界對(duì)成本方面的反應(yīng)有些過(guò)度夸大,,并指出擁有預(yù)訓(xùn)練和推理兩個(gè)范式意味著可以在兩個(gè)維度上優(yōu)化能力,。隨著蒸餾研究的成熟,,降低成本和提升能力愈發(fā)解耦,。OpenAI將繼續(xù)提升低成本提供模型服務(wù)的能力,但也會(huì)繼續(xù)專(zhuān)注于其研究路線圖,,計(jì)劃在今年帶來(lái)更多更好的模型,。
OpenAI研究科學(xué)家Noam Brown也試圖弱化外界對(duì)OpenAI和DeepSeek的對(duì)比,但效果并不明顯,。Mark Chen提到的“外界對(duì)成本方面的反應(yīng)有些過(guò)度夸大”這一點(diǎn)也被廣泛討論,。實(shí)際上,DeepSeek-V3的成本僅包括正式訓(xùn)練,,不包括前期研究,、消融實(shí)驗(yàn)等費(fèi)用。
圖靈獎(jiǎng)得主,、Meta AI首席科學(xué)家Yann LeCun認(rèn)為市場(chǎng)對(duì)于DeepSeek的成本反應(yīng)并不合理,。他指出,巨額投資主要用于維持AI服務(wù)穩(wěn)定運(yùn)行,,而不是僅僅用于訓(xùn)練模型,。隨著AI能力增強(qiáng),維持服務(wù)運(yùn)行的成本會(huì)更高,,關(guān)鍵在于用戶(hù)是否愿意為這些增強(qiáng)的功能付費(fèi),。
不少網(wǎng)友贊同LeCun的觀點(diǎn),認(rèn)為訓(xùn)練和推理成本更低的AI技術(shù)能更快普及,,從而創(chuàng)造更大的市場(chǎng),。從這個(gè)角度來(lái)看,DeepSeek在降低推理成本方面的努力似乎比降低訓(xùn)練成本更為重要,。
面對(duì)可能即將到來(lái)的推理需求激增,,OpenAI、Meta等公司都在做相應(yīng)準(zhǔn)備,,如OpenAI的“星際之門(mén)”項(xiàng)目和Meta的新一年600億美元的AI投資,。2025年,,AI市場(chǎng)的競(jìng)爭(zhēng)依然激烈,DeepSeek在新一年的發(fā)展值得關(guān)注,。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強(qiáng)在哪