短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1。這兩款模型成本低廉,,性能與OpenAI相當(dāng),,引發(fā)了硅谷的震驚,甚至導(dǎo)致Meta內(nèi)部出現(xiàn)恐慌情緒,,工程師們開(kāi)始連夜嘗試復(fù)制DeepSeek的成果,。
Scale AI創(chuàng)始人Alexander Wang在接受采訪時(shí)表示,DeepSeek在他們的測(cè)試中表現(xiàn)最佳,,與中國(guó)科技界的快速發(fā)展有關(guān),。他認(rèn)為,當(dāng)美國(guó)休息時(shí),,中國(guó)科技界在以更低的成本,、更快的速度和更強(qiáng)的實(shí)力追趕上來(lái)。
中國(guó)AI的進(jìn)展引起了國(guó)外媒體的廣泛關(guān)注,,被視為對(duì)硅谷敲響了警鐘,。尤其在5000億美元的“星際之門(mén)”計(jì)劃公布之際,DeepSeek以極低的價(jià)格建立了一個(gè)突破性的AI模型,,且未使用尖端芯片,,這引發(fā)了人們對(duì)巨額資本投入有效性的質(zhì)疑,。
一名匿名的Meta員工透露,DeepSeek-V3在基準(zhǔn)測(cè)試中超越了Llama 4,,讓Meta進(jìn)入恐慌模式,。工程師們正在爭(zhēng)分奪秒地分析DeepSeek的技術(shù),試圖復(fù)制其成果,。管理層也為GenAI研發(fā)部門(mén)的巨額投入感到擔(dān)憂,,因?yàn)橐粋€(gè)高管的薪資就超過(guò)了訓(xùn)練整個(gè)DeepSeek V3的成本。
去年12月27日,,DeepSeek推出了開(kāi)源模型DeepSeek-V3,,在聊天機(jī)器人競(jìng)技場(chǎng)排名第七,在開(kāi)源模型中排名第一,,并且是全球前十中性價(jià)比最高的模型,。不到一個(gè)月后,DeepSeek正式開(kāi)源了R1推理模型,,允許所有人在遵循MIT License的情況下蒸餾R1訓(xùn)練其他模型,。1月24日,DeepSeek-R1在聊天機(jī)器人競(jìng)技場(chǎng)綜合榜單上排名第三,,與頂尖推理模型o1并列,。在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)性極強(qiáng)的領(lǐng)域,,DeepSeek-R1表現(xiàn)出色,,位列第一。
著名投資公司A16z的創(chuàng)始人馬克·安德森稱(chēng),,Deepseek-R1是他見(jiàn)過(guò)最令人印象深刻的突破之一,,而且還是開(kāi)源的,是一份給世界的禮物,。諾獎(jiǎng)得主、“AI教父”杰弗里·辛頓表示,,中國(guó)的STEM教育比美國(guó)更好,,擁有更多受過(guò)良好教育的人才,為AI的發(fā)展提供了堅(jiān)實(shí)基礎(chǔ),。