媒體揭秘國產(chǎn)大模型DeepSeek 硅谷震撼變革

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-27 15:33:19 王新喜

中國國產(chǎn)大模型Deepseek在硅谷引起了轟動,。從斯坦福到麻省理工，Deepseek R1幾乎一夜之間成為美國頂尖大學(xué)研究人員的首選模型,。AMD宣布已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,，該模型旨在與SGLang一起實現(xiàn)最佳性能，并針對AI推理進(jìn)行了優(yōu)化,。

一名Meta員工發(fā)文稱，由于DeepSeek的低成本高性能,，他們公司的人工智能部門陷入恐慌,。自中國深度求索公司發(fā)布DeepSeek-V3模型以來，在雙方的性能測試中,，Meta重金打造的Llama 4模型從未勝出,。在美國匿名職場論壇TeamBlind上，也有Meta員工表示：“Meta生成式人工智能部門陷入恐慌,?！?/p>

美國《商業(yè)內(nèi)幕》網(wǎng)站報道稱，Deepseek這家創(chuàng)新實力超群的中國人工智能初創(chuàng)企業(yè)發(fā)布了新的人工智能模型DeepSeek-R1，完全可以媲美OpenAI的GPT-3模型,，其推理能力令美國科研人員感到震驚,。CNBC上線了一篇長達(dá)40分鐘的視頻紀(jì)錄片，報道了Deepseek的情況,，認(rèn)為這個事情顛覆了他們對AI的常識,。報道指出，Deepseek完全由幻方資助,，沒有外部融資,，而且是開源所有模型，在多項測試中超過了OpenAI的同類模型,，使用的是低功耗的H800芯片,，通過蒸餾大法僅花費了500萬美元，遠(yuǎn)低于Meta公司AI部門任何一位高管的年薪,。

關(guān)于人工智能發(fā)展的三大因素——算法,、算力和數(shù)據(jù)，中國在算力方面一直落后,，主要是因為美國限制臺積電為華為代工人工智能芯片,，并限制中國購買最新的英偉達(dá)顯卡。美國國內(nèi)的AI認(rèn)知認(rèn)為算力是AI的核心,，發(fā)展AI就是要不斷堆算力堆GPU,。然而，DeepSeek-R1是在美國政府不斷加大對中國人工智能領(lǐng)域“卡脖子”力度的背景下誕生的,，它通過創(chuàng)新的工程設(shè)計與高效的訓(xùn)練方法,，在有限的運算能力中實現(xiàn)了高性能，純靠強化學(xué)習(xí)就達(dá)到了與GPT-3相當(dāng)?shù)乃?。其?xùn)練成本極低,，只用了1024張英偉達(dá)H800顯卡，花費只有560萬美元,，而OpenAI的ChatGPT-GPT-3使用了至少一萬張更為先進(jìn)的英偉達(dá)H100顯卡,，成本大約為1億美元。

有媒體形容,，這可能是大語言模型的典范轉(zhuǎn)移,，今后的AI發(fā)展重點在于不依賴龐大的運算資源下創(chuàng)造高質(zhì)量產(chǎn)品。Deepseek的成功證明,，中國這家初創(chuàng)公司以極少的算力,、極低的成本便能達(dá)到美國企業(yè)純粹靠堆算力才能達(dá)到的效果。這對英偉達(dá)及其CPO技術(shù)是絕對利空,。在中國禁先進(jìn)AI算力卡的背景下,，中國可以采用英偉達(dá)20%左右的國產(chǎn)算力卡來與美國競爭,。這意味著，使用中國AI芯片的中國大模型完全可以不遜色于美國頂尖大模型,，而且成本更低,，降低了中小企業(yè)與開發(fā)者的進(jìn)入門檻，增加了選擇性,。

硅谷巨頭們也可能會加入中國的玩法與游戲規(guī)則,，否則根本無法抗衡。這對行業(yè)的影響是,，他們不再需要大量堆GPU,，硬件方面的確定性變得不確定。高性能AI芯片的紅利期可能要過去了,。英偉達(dá)面臨巨大挑戰(zhàn),，或許黃仁勛也沒有想到，有一天會遭遇跨界打擊的命運,。

(責(zé)任編輯：張佳鑫 0764)

關(guān)閉

媒體揭秘國產(chǎn)大模型DeepSeek 硅谷震撼變革

相關(guān)新聞

今日熱點

頻道熱點