春節(jié)期間,國內(nèi)外AI圈都被DeepSeek刷屏,。英偉達(dá)的股市震蕩更是讓全世界矚目,。DeepSeek最近發(fā)布的兩個(gè)模型——DeepSeek-V3和DeepSeek-R1以較低成本獲得了與OpenAI同類模型相當(dāng)?shù)男阅?,這引發(fā)了市場對(duì)AI硬件需求的擔(dān)憂,,投資者擔(dān)心未來對(duì)英偉達(dá)高端芯片的需求可能會(huì)減少,。
關(guān)于DeepSeek技術(shù)創(chuàng)新的討論也非常多,。很多人認(rèn)為,,DeepSeek在硬件受限的情況下走出了一條不同于OpenAI等狂堆算力的道路,通過一系列技術(shù)創(chuàng)新來減少模型對(duì)算力的需求,,同時(shí)提升性能,。這些成就得到了包括Sam Altman在內(nèi)的AI領(lǐng)軍人物的認(rèn)可。
隨后,,OpenAI首席研究官M(fèi)ark Chen發(fā)帖表示,,DeepSeek確實(shí)獨(dú)立發(fā)現(xiàn)了一些OpenAI也在用的核心理念,但這不代表OpenAI在算力上的高投入不合理,。他認(rèn)為外界對(duì)成本方面的反應(yīng)有些過度夸大,,并指出擁有預(yù)訓(xùn)練和推理兩個(gè)范式意味著可以在兩個(gè)維度上優(yōu)化能力。隨著蒸餾研究的成熟,,降低成本和提升能力愈發(fā)解耦,。OpenAI將繼續(xù)提升低成本提供模型服務(wù)的能力,但也會(huì)繼續(xù)專注于其研究路線圖,,計(jì)劃在今年帶來更多更好的模型,。
OpenAI研究科學(xué)家Noam Brown也試圖弱化外界對(duì)OpenAI和DeepSeek的對(duì)比,但效果并不明顯,。Mark Chen提到的“外界對(duì)成本方面的反應(yīng)有些過度夸大”這一點(diǎn)也被廣泛討論,。實(shí)際上,DeepSeek-V3的成本僅包括正式訓(xùn)練,,不包括前期研究,、消融實(shí)驗(yàn)等費(fèi)用。
圖靈獎(jiǎng)得主,、Meta AI首席科學(xué)家Yann LeCun認(rèn)為市場對(duì)于DeepSeek的成本反應(yīng)并不合理,。他指出,巨額投資主要用于維持AI服務(wù)穩(wěn)定運(yùn)行,,而不是僅僅用于訓(xùn)練模型。隨著AI能力增強(qiáng),,維持服務(wù)運(yùn)行的成本會(huì)更高,,關(guān)鍵在于用戶是否愿意為這些增強(qiáng)的功能付費(fèi)。
不少網(wǎng)友贊同LeCun的觀點(diǎn),,認(rèn)為訓(xùn)練和推理成本更低的AI技術(shù)能更快普及,,從而創(chuàng)造更大的市場,。從這個(gè)角度來看,DeepSeek在降低推理成本方面的努力似乎比降低訓(xùn)練成本更為重要,。
面對(duì)可能即將到來的推理需求激增,,OpenAI、Meta等公司都在做相應(yīng)準(zhǔn)備,,如OpenAI的“星際之門”項(xiàng)目和Meta的新一年600億美元的AI投資,。2025年,AI市場的競爭依然激烈,,DeepSeek在新一年的發(fā)展值得關(guān)注,。
國產(chǎn)AI公司深度求索(DeepSeek)的出現(xiàn)不僅吸引了科技界的關(guān)注,,也引起了資本市場的興趣,,并且持續(xù)擴(kuò)展其影響力
2025-02-10 09:15:30券商晨會(huì)精華9月12日,OpenAI在其官網(wǎng)上發(fā)布了一則公告,,宣布向所有訂閱用戶推出OpenAI o1預(yù)覽模型,。這一模型被公眾廣泛關(guān)注,昵稱為“草莓”大模型
2024-09-13 08:15:59OpenAI發(fā)布具有推理能力的AI模型o1