DeepSeek為何在美國引起巨大關(guān)注打破大模型壟斷

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-28 19:34:24 環(huán)球時(shí)報(bào)

這幾天,，中國人工智能初創(chuàng)公司DeepSeek在美區(qū)下載榜上超越了ChatGPT,，還引發(fā)多個(gè)美國科技股股價(jià)暴跌,。美國總統(tǒng)特朗普稱DeepSeek的出現(xiàn)“給美國相關(guān)產(chǎn)業(yè)敲響了警鐘”,。

DeepSeek為何在美國引起巨大關(guān)注

DeepSeek用較少的資金實(shí)現(xiàn)了與世界頂尖大模型如GPT-4相媲美的性能,。OpenAI訓(xùn)練ChatGPT-4的成本高達(dá)7800萬美元甚至可能達(dá)到1億美元,，而DeepSeek的大模型訓(xùn)練成本不到600萬美元,，僅為同性能模型的5%到10%,。新模型訓(xùn)練方法大幅降低了大模型行業(yè)的入局門檻,，使得大規(guī)模預(yù)訓(xùn)練不再是科技巨頭的專利,。此外，在模型推理層面,，DeepSeek推出的DeepSeek-R1價(jià)格為2.2美元/百萬詞元,，而同性能的OpenAI-o1價(jià)格為60美元/百萬詞元，前者僅為后者的三十分之一,。這種低成本顯著改善了大模型的應(yīng)用成本,，對科研、企業(yè)等智力密集型產(chǎn)業(yè)具有重大價(jià)值,。因此,，無論是從基礎(chǔ)研究角度還是商業(yè)層面上看，DeepSeek對美國一些大模型公司的既有模式構(gòu)成了沖擊,。

DeepSeek為何在美國引起巨大關(guān)注打破大模型壟斷

DeepSeek開發(fā)成本大幅降低的原因在于其應(yīng)用了不同的模型訓(xùn)練模式,，打破了美國堆砌算力的方式。在數(shù)據(jù)喂養(yǎng)這一重要環(huán)節(jié)上,，OpenAI選擇了“人海戰(zhàn)術(shù)”,，通過海量數(shù)據(jù)投喂提升能力。而DeepSeek則利用算法對數(shù)據(jù)進(jìn)行總結(jié)和分類，經(jīng)過選擇性處理后再輸送給大模型,，從而優(yōu)化了算力并降低了成本,。目前來看,，Meta耗費(fèi)大量資金訓(xùn)練Llama,，但效果不如成本極低的DeepSeek。這引發(fā)了Meta高層和技術(shù)人員的恐慌,，他們擔(dān)心自己的技術(shù)能力和創(chuàng)新性被質(zhì)疑,，從而失去工作。社交媒體上的討論也顯示,，關(guān)于DeepSeek的帖子數(shù)量遠(yuǎn)高于新聞報(bào)道,，且討論時(shí)間早于新聞媒體五天，這主要是由從事科技工作的自媒體人和員工圈層傳播所致,。

DeepSeek為何在美國引起巨大關(guān)注打破大模型壟斷

根據(jù)中國工業(yè)互聯(lián)網(wǎng)研究院發(fā)布的《人工智能大模型年度發(fā)展趨勢報(bào)告》,，2024年國內(nèi)大模型的能力進(jìn)步顯著。從2023年第四季度到2025年第一季度的測評(píng)顯示,，國內(nèi)外大模型能力差距縮小了將近75%,。這表明DeepSeek的出現(xiàn)是中國國內(nèi)大模型整體發(fā)展的階段性成果。盡管中國在AI領(lǐng)域的投資額僅為美國的十一分之一,，但在未來仍有很大的發(fā)展空間,。

如今，許多業(yè)內(nèi)人士都喊出了“DeepSeek接班OpenAI”的口號(hào),。事實(shí)上,，DeepSeek的出現(xiàn)并不是要取代其他公司，而是提出了更多樣化的方案,，打破了國際主流大模型的市場壟斷,，在大模型的發(fā)展道路上提供了不同于西方的中國解法，向世界展示了在大模型領(lǐng)域不僅僅只有拼算力一條路,，再次證明了中國智慧的價(jià)值,。

(責(zé)任編輯：張佳鑫 0764)

關(guān)閉

DeepSeek為何在美國引起巨大關(guān)注 打破大模型壟斷

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek為何在美國引起巨大關(guān)注打破大模型壟斷