幻方DeepSeek如何“震驚”硅谷性價(jià)比與開源的勝利

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-27 10:02:46 第一財(cái)經(jīng)

過去一周,，中國的人工智能大模型成為硅谷乃至全球科技界的熱議話題。引發(fā)這場討論的是中國人工智能初創(chuàng)公司深度求索（DeepSeek）,。該公司上周發(fā)布的推理大模型DeepSeek-R1因其性能可比肩OpenAI的o1、極低的服務(wù)價(jià)格以及代碼和模型架構(gòu)的完全開源而震驚業(yè)界,。

多位知名科技人士對(duì)DeepSeek近期取得的成就表示贊嘆,。Scale AI創(chuàng)始人亞歷山大·王稱，美國可能在過去的十年里一直領(lǐng)先于中國,，但DeepSeek的發(fā)布可能會(huì)“改變一切”,。加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)教授伊恩·斯托伊卡表示，DeepSeek-R1只需花費(fèi)訓(xùn)練GPT,、Gemini和Claude等現(xiàn)有大模型的一小部分成本即可獲得最先進(jìn)的結(jié)果,，并且在該校的大模型排行榜中排名第三,。

這一成就在美國對(duì)華芯片出口管制加強(qiáng)的背景下實(shí)現(xiàn),。斯托伊卡認(rèn)為,，限制條件和資源匱乏往往會(huì)激發(fā)創(chuàng)新,。

受到規(guī)模定律的影響，全球AI大模型開發(fā)長期以來陷入了一場關(guān)于頂尖人才、先進(jìn)算力和巨額投資的競爭,。各大科技公司大量囤積芯片以確保充足的算力。然而，當(dāng)越來越多科學(xué)家開始質(zhì)疑堆數(shù)據(jù)和堆算力的做法時(shí)，中國量化交易公司幻方量化旗下的人工智能初創(chuàng)公司DeepSeek橫空出世，通過優(yōu)化模型架構(gòu)和基礎(chǔ)設(shè)施等方式快速突進(jìn)。

早在去年12月,，該公司推出的DeepSeek-V3展現(xiàn)了極致性價(jià)比。從技術(shù)報(bào)告來看，該模型僅需2.788M H800 GPU小時(shí),，訓(xùn)練成本僅為557萬美元,，但其性能與GPT-4o和Claude Sonnet 3.5等頂尖模型相當(dāng)。著名人工智能科學(xué)家卡帕西指出,，這種級(jí)別的能力通常需要接近16000顆GPU的集群,。

最新發(fā)布的DeepSeek-R1在服務(wù)價(jià)格上也具有明顯優(yōu)勢(shì)。其API服務(wù)定價(jià)為每百萬輸入tokens 1元（緩存命中）/ 4元（緩存未命中）,，分別是OpenAI o1的2%和3.6%,。外界普遍認(rèn)為，美國尖端芯片出口管制并沒有削弱中國的AI能力,，反而推動(dòng)了DeepSeek等初創(chuàng)公司以效率,、資源池和協(xié)作的方式進(jìn)行創(chuàng)新。

12 全文共 2 頁下一頁

關(guān)閉

幻方DeepSeek如何“震驚”硅谷 性價(jià)比與開源的勝利

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

幻方DeepSeek如何“震驚”硅谷性價(jià)比與開源的勝利