DeepSeek為何在美國引起巨大關(guān)注打破大模型壟斷

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-28 19:34:24 環(huán)球時報

這幾天,，中國人工智能初創(chuàng)公司DeepSeek在美區(qū)下載榜上超越了ChatGPT,，還引發(fā)多個美國科技股股價暴跌。美國總統(tǒng)特朗普稱DeepSeek的出現(xiàn)“給美國相關(guān)產(chǎn)業(yè)敲響了警鐘”,。

DeepSeek用較少的資金實現(xiàn)了與世界頂尖大模型如GPT-4相媲美的性能,。OpenAI訓(xùn)練ChatGPT-4的成本高達(dá)7800萬美元甚至可能達(dá)到1億美元，而DeepSeek的大模型訓(xùn)練成本不到600萬美元,，僅為同性能模型的5%到10%,。新模型訓(xùn)練方法大幅降低了大模型行業(yè)的入局門檻，使得大規(guī)模預(yù)訓(xùn)練不再是科技巨頭的專利,。此外,，在模型推理層面，DeepSeek推出的DeepSeek-R1價格為2.2美元/百萬詞元,，而同性能的OpenAI-o1價格為60美元/百萬詞元,，前者僅為后者的三十分之一。這種低成本顯著改善了大模型的應(yīng)用成本,，對科研,、企業(yè)等智力密集型產(chǎn)業(yè)具有重大價值。因此,，無論是從基礎(chǔ)研究角度還是商業(yè)層面上看,，DeepSeek對美國一些大模型公司的既有模式構(gòu)成了沖擊。

DeepSeek開發(fā)成本大幅降低的原因在于其應(yīng)用了不同的模型訓(xùn)練模式,，打破了美國堆砌算力的方式,。在數(shù)據(jù)喂養(yǎng)這一重要環(huán)節(jié)上，OpenAI選擇了“人海戰(zhàn)術(shù)”,，通過海量數(shù)據(jù)投喂提升能力,。而DeepSeek則利用算法對數(shù)據(jù)進(jìn)行總結(jié)和分類，經(jīng)過選擇性處理后再輸送給大模型,，從而優(yōu)化了算力并降低了成本,。目前來看，Meta耗費(fèi)大量資金訓(xùn)練Llama,，但效果不如成本極低的DeepSeek,。這引發(fā)了Meta高層和技術(shù)人員的恐慌，他們擔(dān)心自己的技術(shù)能力和創(chuàng)新性被質(zhì)疑,，從而失去工作,。社交媒體上的討論也顯示，關(guān)于DeepSeek的帖子數(shù)量遠(yuǎn)高于新聞報道,，且討論時間早于新聞媒體五天,，這主要是由從事科技工作的自媒體人和員工圈層傳播所致。

根據(jù)中國工業(yè)互聯(lián)網(wǎng)研究院發(fā)布的《人工智能大模型年度發(fā)展趨勢報告》,，2024年國內(nèi)大模型的能力進(jìn)步顯著,。從2023年第四季度到2025年第一季度的測評顯示，國內(nèi)外大模型能力差距縮小了將近75%,。這表明DeepSeek的出現(xiàn)是中國國內(nèi)大模型整體發(fā)展的階段性成果,。盡管中國在AI領(lǐng)域的投資額僅為美國的十一分之一，但在未來仍有很大的發(fā)展空間,。

如今,，許多業(yè)內(nèi)人士都喊出了“DeepSeek接班OpenAI”的口號。事實上,，DeepSeek的出現(xiàn)并不是要取代其他公司,，而是提出了更多樣化的方案，打破了國際主流大模型的市場壟斷,，在大模型的發(fā)展道路上提供了不同于西方的中國解法,，向世界展示了在大模型領(lǐng)域不僅僅只有拼算力一條路，再次證明了中國智慧的價值,。

(責(zé)任編輯：張佳鑫 0764)

關(guān)閉

DeepSeek為何在美國引起巨大關(guān)注 打破大模型壟斷

相關(guān)新聞

今日熱點

頻道熱點

DeepSeek為何在美國引起巨大關(guān)注打破大模型壟斷