DeepSeek新模型“火”到海外引發(fā)硅谷恐慌

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-26 15:51:02 每日經(jīng)濟(jì)新聞

短短一個月內(nèi)，中國AI初創(chuàng)公司深度求索（DeepSeek）發(fā)布了兩款大模型：DeepSeek-V3和DeepSeek-R1,。這兩款模型成本低廉,，性能與OpenAI相當(dāng)，引發(fā)了硅谷的震驚，甚至導(dǎo)致Meta內(nèi)部出現(xiàn)恐慌情緒，工程師們開始連夜嘗試復(fù)制DeepSeek的成果,。

Scale AI創(chuàng)始人Alexander Wang在接受采訪時表示，DeepSeek在他們的測試中表現(xiàn)最佳,，與中國科技界的快速發(fā)展有關(guān),。他認(rèn)為，當(dāng)美國休息時,，中國科技界在以更低的成本,、更快的速度和更強(qiáng)的實(shí)力追趕上來。

中國AI的進(jìn)展引起了國外媒體的廣泛關(guān)注,，被視為對硅谷敲響了警鐘,。尤其在5000億美元的“星際之門”計(jì)劃公布之際，DeepSeek以極低的價格建立了一個突破性的AI模型,，且未使用尖端芯片,，這引發(fā)了人們對巨額資本投入有效性的質(zhì)疑。

一名匿名的Meta員工透露,，DeepSeek-V3在基準(zhǔn)測試中超越了Llama 4,，讓Meta進(jìn)入恐慌模式。工程師們正在爭分奪秒地分析DeepSeek的技術(shù),，試圖復(fù)制其成果,。管理層也為GenAI研發(fā)部門的巨額投入感到擔(dān)憂，因?yàn)橐粋€高管的薪資就超過了訓(xùn)練整個DeepSeek V3的成本,。

去年12月27日,，DeepSeek推出了開源模型DeepSeek-V3，在聊天機(jī)器人競技場排名第七,，在開源模型中排名第一,，并且是全球前十中性價比最高的模型。不到一個月后,，DeepSeek正式開源了R1推理模型,，允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型。1月24日,，DeepSeek-R1在聊天機(jī)器人競技場綜合榜單上排名第三,，與頂尖推理模型o1并列。在高難度提示詞,、代碼和數(shù)學(xué)等技術(shù)性極強(qiáng)的領(lǐng)域,，DeepSeek-R1表現(xiàn)出色，位列第一,。

著名投資公司A16z的創(chuàng)始人馬克·安德森稱,，Deepseek-R1是他見過最令人印象深刻的突破之一,，而且還是開源的，是一份給世界的禮物,。諾獎得主,、“AI教父”杰弗里·辛頓表示，中國的STEM教育比美國更好,，擁有更多受過良好教育的人才,，為AI的發(fā)展提供了堅(jiān)實(shí)基礎(chǔ)。

斯坦福大學(xué)和Epoch AI的研究人員研究表明,，到2027年,，最大型模型的訓(xùn)練成本將超過10億美元。然而,，DeepSeek的訓(xùn)練成本并不昂貴,，Noah"s Arc資本管理公司認(rèn)為，DeepSeek-V3模型有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則,。

DeepSeek的發(fā)布引發(fā)了投資者和財(cái)經(jīng)記者的關(guān)注,。有觀點(diǎn)認(rèn)為，如果擊敗OpenAI只需要5500萬美元,，那么AI行業(yè)的商業(yè)化進(jìn)程可能會比預(yù)期更快,。英偉達(dá)股價也因DeepSeek的發(fā)布而下跌。

國外媒體紛紛報道DeepSeek的新進(jìn)展,，一致認(rèn)為這為硅谷敲響了警鐘,。Business Insider、CNBC和英國《金融時報》等媒體均對此進(jìn)行了深入報道,，討論了資源更豐富的美國AI公司能否捍衛(wèi)自己的技術(shù)優(yōu)勢,。加州大學(xué)伯克利分校AI政策研究員Ritwik Gupta指出，中國的系統(tǒng)工程師人才庫更大,，懂得如何充分利用計(jì)算資源來更便宜地訓(xùn)練和運(yùn)行模型,。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

DeepSeek新模型“火”到海外 引發(fā)硅谷恐慌

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek新模型“火”到海外引發(fā)硅谷恐慌