這幾天,,中國人工智能初創(chuàng)公司DeepSeek在美區(qū)下載榜上超越了ChatGPT,還引發(fā)多個美國科技股股價暴跌,。美國總統(tǒng)特朗普稱DeepSeek的出現(xiàn)“給美國相關(guān)產(chǎn)業(yè)敲響了警鐘”,。
DeepSeek用較少的資金實現(xiàn)了與世界頂尖大模型如GPT-4相媲美的性能。OpenAI訓(xùn)練ChatGPT-4的成本高達7800萬美元甚至可能達到1億美元,,而DeepSeek的大模型訓(xùn)練成本不到600萬美元,,僅為同性能模型的5%到10%。新模型訓(xùn)練方法大幅降低了大模型行業(yè)的入局門檻,,使得大規(guī)模預(yù)訓(xùn)練不再是科技巨頭的專利,。此外,在模型推理層面,,DeepSeek推出的DeepSeek-R1價格為2.2美元/百萬詞元,,而同性能的OpenAI-o1價格為60美元/百萬詞元,前者僅為后者的三十分之一,。這種低成本顯著改善了大模型的應(yīng)用成本,,對科研、企業(yè)等智力密集型產(chǎn)業(yè)具有重大價值,。因此,,無論是從基礎(chǔ)研究角度還是商業(yè)層面上看,DeepSeek對美國一些大模型公司的既有模式構(gòu)成了沖擊,。
DeepSeek開發(fā)成本大幅降低的原因在于其應(yīng)用了不同的模型訓(xùn)練模式,,打破了美國堆砌算力的方式。在數(shù)據(jù)喂養(yǎng)這一重要環(huán)節(jié)上,,OpenAI選擇了“人海戰(zhàn)術(shù)”,,通過海量數(shù)據(jù)投喂提升能力。而DeepSeek則利用算法對數(shù)據(jù)進行總結(jié)和分類,,經(jīng)過選擇性處理后再輸送給大模型,,從而優(yōu)化了算力并降低了成本。目前來看,,Meta耗費大量資金訓(xùn)練Llama,,但效果不如成本極低的DeepSeek,。這引發(fā)了Meta高層和技術(shù)人員的恐慌,他們擔(dān)心自己的技術(shù)能力和創(chuàng)新性被質(zhì)疑,,從而失去工作,。社交媒體上的討論也顯示,關(guān)于DeepSeek的帖子數(shù)量遠高于新聞報道,,且討論時間早于新聞媒體五天,,這主要是由從事科技工作的自媒體人和員工圈層傳播所致。
根據(jù)中國工業(yè)互聯(lián)網(wǎng)研究院發(fā)布的《人工智能大模型年度發(fā)展趨勢報告》,,2024年國內(nèi)大模型的能力進步顯著,。從2023年第四季度到2025年第一季度的測評顯示,國內(nèi)外大模型能力差距縮小了將近75%,。這表明DeepSeek的出現(xiàn)是中國國內(nèi)大模型整體發(fā)展的階段性成果,。盡管中國在AI領(lǐng)域的投資額僅為美國的十一分之一,但在未來仍有很大的發(fā)展空間,。
如今,,許多業(yè)內(nèi)人士都喊出了“DeepSeek接班OpenAI”的口號。事實上,,DeepSeek的出現(xiàn)并不是要取代其他公司,,而是提出了更多樣化的方案,打破了國際主流大模型的市場壟斷,,在大模型的發(fā)展道路上提供了不同于西方的中國解法,,向世界展示了在大模型領(lǐng)域不僅僅只有拼算力一條路,再次證明了中國智慧的價值,。
國產(chǎn)AI公司深度求索(DeepSeek)的出現(xiàn)不僅成為科技圈焦點,,也引起了資本市場的廣泛關(guān)注,,并且還在不斷擴展影響力
2025-02-08 07:58:52為何說DeepSeek改變了AI的投資邏輯