中國AI初創(chuàng)公司深度求索(DeepSeek)在短短一個(gè)月內(nèi)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1,。這兩款模型成本低廉,性能與OpenAI相當(dāng),,引起了硅谷的關(guān)注,,甚至引發(fā)了Meta內(nèi)部的恐慌,,工程師們開始連夜嘗試復(fù)制DeepSeek的成果,。
Scale AI創(chuàng)始人Alexander Wang在接受采訪時(shí)提到,DeepSeek在他們的測(cè)試中表現(xiàn)最好,,與美國最好的模型相當(dāng),。他還表示,DeepSeek-V3是中國科技界帶給美國的一個(gè)苦澀教訓(xùn),,中國以更低的成本,、更快的速度和更強(qiáng)的實(shí)力趕超了美國。
國外媒體也對(duì)中國AI的新進(jìn)展給予了高度關(guān)注,,認(rèn)為這些進(jìn)展為硅谷敲響了警鐘,。在5000億美元的“星際之門”計(jì)劃公布之際,DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型,,且未使用尖端芯片,,這讓人質(zhì)疑巨額資本投入是否是最有效的方法,。
一名Meta員工在匿名平臺(tái)上透露,由于DeepSeek-V3的表現(xiàn),,Meta已經(jīng)進(jìn)入恐慌模式,。DeepSeek-V3在基準(zhǔn)測(cè)試中超越了Llama 4,而其訓(xùn)練預(yù)算僅為550萬美元,。Meta的工程師們正在爭分奪秒地分析DeepSeek的技術(shù),,試圖復(fù)制其成功。管理層則為GenAI研發(fā)部門的巨額投入感到焦慮,,因?yàn)閱蝹€(gè)高管的薪資就超過了訓(xùn)練整個(gè)DeepSeek V3的成本,。
去年12月27日,DeepSeek推出開源模型DeepSeek-V3,,在聊天機(jī)器人競技場(chǎng)排名第七,是全球前十中性價(jià)比最高的模型,。不到一個(gè)月后,,DeepSeek正式開源R1推理模型,允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型,。1月24日,,DeepSeek-R1在聊天機(jī)器人競技場(chǎng)綜合榜單上排名第三,與頂尖推理模型o1并列,。在高難度提示詞,、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域,DeepSeek-R1表現(xiàn)出色,,排名第一,。風(fēng)格控制方面,DeepSeek-R1同樣與o1并列第一,。