DeepSeek大模型強(qiáng)在哪引發(fā)硅谷恐慌

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-27 08:21:32 每日經(jīng)濟(jì)新聞

短短一個(gè)月內(nèi),，中國(guó)AI初創(chuàng)公司深度求索（DeepSeek）發(fā)布了兩款大模型：DeepSeek-V3和DeepSeek-R1,。這兩款模型成本低廉,，性能與OpenAI相當(dāng)，讓硅谷震驚,，并引發(fā)了Meta內(nèi)部的恐慌,，工程師們開(kāi)始連夜嘗試復(fù)制DeepSeek的成果。

Scale AI創(chuàng)始人Alexander Wang在采訪中表示,，DeepSeek在他們的測(cè)試?yán)锉憩F(xiàn)最好,，與美國(guó)最好的模型相當(dāng)。他還提到,，DeepSeek-V3是中國(guó)科技界帶給美國(guó)的一個(gè)教訓(xùn),，中國(guó)以更低的成本、更快的速度和更強(qiáng)的實(shí)力追趕上來(lái)。

中國(guó)AI的新進(jìn)展引起了國(guó)外媒體的廣泛關(guān)注,，被視為對(duì)硅谷的一次警鐘,。尤其是在5000億美元的“星際之門”計(jì)劃公布之際，DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型,，而且沒(méi)有使用尖端芯片,，這引發(fā)了人們對(duì)于巨額資本投入是否有效的質(zhì)疑。

一名匿名Meta員工透露,，公司內(nèi)部因DeepSeek的模型進(jìn)入了恐慌模式,。DeepSeek-V3在基準(zhǔn)測(cè)試中已經(jīng)超越了Llama 4，而其訓(xùn)練預(yù)算僅為550萬(wàn)美元,。工程師們正在爭(zhēng)分奪秒地分析DeepSeek,，試圖復(fù)制其中的技術(shù)。管理層則為GenAI研發(fā)部門的巨額投入感到焦慮,，高管薪資甚至超過(guò)了訓(xùn)練整個(gè)DeepSeek V3的成本,。

去年12月27日，DeepSeek推出了開(kāi)源模型DeepSeek-V3,，在聊天機(jī)器人競(jìng)技場(chǎng)中排名第七,，在開(kāi)源模型中排名第一，且是全球前十中性價(jià)比最高的模型,。今年1月20日,，DeepSeek正式開(kāi)源R1推理模型，允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型,。1月24日，DeepSeek-R1在聊天機(jī)器人競(jìng)技場(chǎng)綜合榜單上排名第三,，與頂尖推理模型o1并列,。在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)性領(lǐng)域,，DeepSeek-R1表現(xiàn)出色,，位列第一。在風(fēng)格控制方面,，DeepSeek-R1也與o1并列第一,。

12 全文共 2 頁(yè)下一頁(yè)

關(guān)閉

DeepSeek大模型強(qiáng)在哪 引發(fā)硅谷恐慌

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek大模型強(qiáng)在哪引發(fā)硅谷恐慌