DeepSeek“刷屏”硅谷背后中國(guó)AI崛起引發(fā)恐慌

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-27 08:52:31 每日經(jīng)濟(jì)新聞

短短一個(gè)月內(nèi),，中國(guó)AI初創(chuàng)公司深度求索（DeepSeek）發(fā)布了兩款大模型：DeepSeek-V3和DeepSeek-R1,。這兩款模型成本低廉,，性能卻與OpenAI相當(dāng)，引發(fā)了硅谷的震動(dòng),，甚至讓Meta內(nèi)部陷入恐慌，工程師們開始連夜嘗試復(fù)制DeepSeek的成果,。

Scale AI創(chuàng)始人Alexander Wang在采訪中表示,，DeepSeek在他們的測(cè)試中表現(xiàn)最佳，與美國(guó)最好的模型相當(dāng),。他之前曾評(píng)價(jià)說,，DeepSeek-V3是中國(guó)科技界帶給美國(guó)的一個(gè)苦澀教訓(xùn)，指出當(dāng)美國(guó)休息時(shí),，中國(guó)科技界以更低的成本,、更快的速度和更強(qiáng)的實(shí)力迎頭趕上。

中國(guó)AI的新進(jìn)展也引起了國(guó)外媒體的關(guān)注,，他們認(rèn)為這些新進(jìn)展為硅谷敲響了警鐘,。特別是在5000億美元的“星際之門”計(jì)劃公布之際，DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型,，且沒有使用尖端芯片,，這讓人們質(zhì)疑巨額資本投入是否真的是最有效的方法。

一名Meta員工在匿名平臺(tái)teamblind上發(fā)帖稱,，由于DeepSeek-V3的表現(xiàn),，Meta已經(jīng)進(jìn)入恐慌模式。DeepSeek-V3在基準(zhǔn)測(cè)試中超越了Llama 4,，而其訓(xùn)練預(yù)算僅為550萬美元,。Meta工程師們正爭(zhēng)分奪秒地分析DeepSeek的技術(shù)，試圖復(fù)制其成果,。管理層則因GenAI研發(fā)部門的巨額投入感到焦慮,，因?yàn)橐粋€(gè)高管的薪資就超過了整個(gè)DeepSeek V3的訓(xùn)練成本。

去年12月27日,，DeepSeek推出了開源模型DeepSeek-V3,，在聊天機(jī)器人競(jìng)技場(chǎng)排名第七，在開源模型中排名第一,，并被認(rèn)為是全球前十中性價(jià)比最高的模型,。今年1月20日，DeepSeek正式開源R1推理模型,，允許所有人遵循MIT License蒸餾R1訓(xùn)練其他模型,。1月24日，DeepSeek-R1在聊天機(jī)器人競(jìng)技場(chǎng)綜合榜單上排名第三,，與頂尖推理模型o1并列,。在高難度提示詞,、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域，DeepSeek-R1表現(xiàn)出色,，風(fēng)格控制方面也與o1并列第一,。

12 全文共 2 頁下一頁

關(guān)閉

DeepSeek“刷屏”硅谷背后 中國(guó)AI崛起引發(fā)恐慌

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek“刷屏”硅谷背后中國(guó)AI崛起引發(fā)恐慌