中國AI初創(chuàng)公司深度求索(DeepSeek)在短短一個(gè)月內(nèi)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1,。這兩款模型成本低廉,,性能與OpenAI相當(dāng),,引起了硅谷的關(guān)注,,甚至引發(fā)了Meta內(nèi)部的恐慌,工程師們開始連夜嘗試復(fù)制DeepSeek的成果,。
Scale AI創(chuàng)始人Alexander Wang在接受采訪時(shí)提到,,DeepSeek在他們的測試中表現(xiàn)最好,與美國最好的模型相當(dāng),。他還表示,,DeepSeek-V3是中國科技界帶給美國的一個(gè)苦澀教訓(xùn),中國以更低的成本,、更快的速度和更強(qiáng)的實(shí)力趕超了美國,。
國外媒體也對(duì)中國AI的新進(jìn)展給予了高度關(guān)注,認(rèn)為這些進(jìn)展為硅谷敲響了警鐘,。在5000億美元的“星際之門”計(jì)劃公布之際,,DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型,且未使用尖端芯片,,這讓人質(zhì)疑巨額資本投入是否是最有效的方法,。
一名Meta員工在匿名平臺(tái)上透露,由于DeepSeek-V3的表現(xiàn),,Meta已經(jīng)進(jìn)入恐慌模式,。DeepSeek-V3在基準(zhǔn)測試中超越了Llama 4,而其訓(xùn)練預(yù)算僅為550萬美元,。Meta的工程師們正在爭分奪秒地分析DeepSeek的技術(shù),,試圖復(fù)制其成功。管理層則為GenAI研發(fā)部門的巨額投入感到焦慮,,因?yàn)閱蝹€(gè)高管的薪資就超過了訓(xùn)練整個(gè)DeepSeek V3的成本,。
去年12月27日,DeepSeek推出開源模型DeepSeek-V3,,在聊天機(jī)器人競技場排名第七,,是全球前十中性價(jià)比最高的模型。不到一個(gè)月后,,DeepSeek正式開源R1推理模型,,允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型。1月24日,,DeepSeek-R1在聊天機(jī)器人競技場綜合榜單上排名第三,,與頂尖推理模型o1并列。在高難度提示詞,、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域,,DeepSeek-R1表現(xiàn)出色,排名第一,。風(fēng)格控制方面,,DeepSeek-R1同樣與o1并列第一,。
著名投資公司A16z的創(chuàng)始人馬克·安德森稱贊Deepseek-R1是他見過最令人驚嘆的突破之一,而且還是開源的,。A16z合伙人Anjney Midha也表示,,DeepSeek-R1幾乎一夜之間成為美國頂尖大學(xué)研究人員的首選模型。
對(duì)于中國AI快速發(fā)展的原因,,諾獎(jiǎng)得主,、“AI教父”杰弗里·辛頓認(rèn)為中國的STEM教育比美國更好,擁有更多受過良好教育的人才,,這為AI的發(fā)展提供了堅(jiān)實(shí)的基礎(chǔ),。盡管美國試圖通過限制來減緩中國的發(fā)展,但這只會(huì)促使中國加速發(fā)展自己的技術(shù),。
斯坦福大學(xué)和Epoch AI的研究人員發(fā)表的研究表明,,到2027年,最大型的模型訓(xùn)練成本將超過10億美元,。然而,,DeepSeek的訓(xùn)練成本并不昂貴,Noah's Arc資本管理公司認(rèn)為DeepSeek-V3有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則,。一些投資者對(duì)此表示擔(dān)憂,,認(rèn)為這種低成本的突破可能會(huì)對(duì)行業(yè)帶來重大影響,甚至挑戰(zhàn)美股芯片股的股價(jià),。
外媒紛紛報(bào)道DeepSeek的新進(jìn)展,,認(rèn)為其為硅谷敲響了警鐘。Business Insider報(bào)道稱,,DeepSeek-R1的開源特性可能挑戰(zhàn)那些試圖通過出售技術(shù)賺取巨額利潤的公司。CNBC邀請(qǐng)Perplexity CEO Aravind Srinivas分析了DeepSeek引發(fā)的擔(dān)憂,。英國《金融時(shí)報(bào)》也報(bào)道了DeepSeek如何震驚硅谷,,并探討了資源更豐富的美國AI公司能否捍衛(wèi)其技術(shù)優(yōu)勢。加州大學(xué)伯克利分校AI政策研究員Ritwik Gupta指出,,中國的系統(tǒng)工程師人才庫比美國大得多,,他們懂得如何充分利用計(jì)算資源來更便宜地訓(xùn)練和運(yùn)行模型。
DeepSeek 給硅谷帶來的震撼持續(xù)不斷。與幾個(gè)月前《黑神話·悟空》在歐美受到的追捧相比,,DeepSeek 的出現(xiàn)可謂石破天驚,,充滿了各種不可能和不合理
2025-01-26 14:46:44起底讓硅谷難安的DeepSeek短短一個(gè)月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強(qiáng)在哪