DeepSeek大模型強(qiáng)在哪引發(fā)硅谷恐慌

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-27 08:21:32 每日經(jīng)濟(jì)新聞

短短一個月內(nèi),，中國AI初創(chuàng)公司深度求索（DeepSeek）發(fā)布了兩款大模型：DeepSeek-V3和DeepSeek-R1,。這兩款模型成本低廉，性能與OpenAI相當(dāng),，讓硅谷震驚,，并引發(fā)了Meta內(nèi)部的恐慌，工程師們開始連夜嘗試復(fù)制DeepSeek的成果,。

Scale AI創(chuàng)始人Alexander Wang在采訪中表示,，DeepSeek在他們的測試?yán)锉憩F(xiàn)最好，與美國最好的模型相當(dāng),。他還提到,，DeepSeek-V3是中國科技界帶給美國的一個教訓(xùn)，中國以更低的成本,、更快的速度和更強(qiáng)的實(shí)力追趕上來,。

中國AI的新進(jìn)展引起了國外媒體的廣泛關(guān)注，被視為對硅谷的一次警鐘,。尤其是在5000億美元的“星際之門”計劃公布之際,，DeepSeek以極低的價格建立了一個突破性的AI模型，而且沒有使用尖端芯片,，這引發(fā)了人們對于巨額資本投入是否有效的質(zhì)疑,。

一名匿名Meta員工透露，公司內(nèi)部因DeepSeek的模型進(jìn)入了恐慌模式,。DeepSeek-V3在基準(zhǔn)測試中已經(jīng)超越了Llama 4,，而其訓(xùn)練預(yù)算僅為550萬美元。工程師們正在爭分奪秒地分析DeepSeek,，試圖復(fù)制其中的技術(shù),。管理層則為GenAI研發(fā)部門的巨額投入感到焦慮，高管薪資甚至超過了訓(xùn)練整個DeepSeek V3的成本,。

去年12月27日,，DeepSeek推出了開源模型DeepSeek-V3，在聊天機(jī)器人競技場中排名第七,，在開源模型中排名第一,，且是全球前十中性價比最高的模型。今年1月20日,，DeepSeek正式開源R1推理模型,，允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型。1月24日,，DeepSeek-R1在聊天機(jī)器人競技場綜合榜單上排名第三,，與頂尖推理模型o1并列。在高難度提示詞,、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域,，DeepSeek-R1表現(xiàn)出色,，位列第一。在風(fēng)格控制方面,，DeepSeek-R1也與o1并列第一,。

著名投資公司A16z的創(chuàng)始人馬克·安德森認(rèn)為，Deepseek-R1是他見過的最令人驚嘆的突破之一,，而且還是開源的,。A16z合伙人Anjney Midha表示，DeepSeek-R1幾乎一夜之間成為美國頂尖大學(xué)研究人員的首選模型,。諾獎得主,、“AI教父”杰弗里·辛頓指出，中國的STEM教育比美國更好,，擁有更多受過良好教育的人才,，這為AI的發(fā)展提供了堅實(shí)的基礎(chǔ)。

斯坦福大學(xué)和Epoch AI的研究人員預(yù)測,，到2027年,，最大型模型的訓(xùn)練成本將超過10億美元。Gartner預(yù)測,，到2028年,，Google、Microsoft和AWS等超大規(guī)模企業(yè)僅在AI服務(wù)器上的支出就將高達(dá)5000億美元,。然而,，DeepSeek的訓(xùn)練成本并不昂貴，有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則,。

美股大V“THE SHORT BEAR”認(rèn)為，DeepSeek給AI巨頭們帶來了痛苦時刻,，投資者必須對此敲響警鐘,。財經(jīng)記者Holger Zschaepitz也表示，DeepSeek以極低的價格建立了一個突破性的AI模型,，這讓人們質(zhì)疑該行業(yè)數(shù)千億美元資本支出的效用,。有投資者甚至認(rèn)為，美股芯片股的股價也會面臨挑戰(zhàn),。

外媒普遍認(rèn)為,，DeepSeek的新進(jìn)展為硅谷敲響了警鐘,。Business Insider報道稱,，DeepSeek-R1模型秉承開放精神，完全開源,，為美國AI玩家?guī)砹寺闊?。CNBC邀請了Perplexity CEO Aravind Srinivas來分析為何DeepSeek會引發(fā)人們對美國在AI領(lǐng)域的全球領(lǐng)先地位是否正在縮小的擔(dān)憂。英國《金融時報》報道,，中國小型AI初創(chuàng)公司DeepSeek震驚硅谷,，加州大學(xué)伯克利分校AI政策研究員Ritwik Gupta稱，中國的系統(tǒng)工程師人才庫比美國大得多,，他們懂得如何充分利用計算資源來更便宜地訓(xùn)練和運(yùn)行模型,。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

DeepSeek大模型強(qiáng)在哪 引發(fā)硅谷恐慌

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek大模型強(qiáng)在哪引發(fā)硅谷恐慌