百度前首席科學家解讀DeepSeek AI新突破引發(fā)爭議

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-01-31 16:00:03 鞭牛士

中國人工智能公司DeepSeek最近聲稱其新的人工智能模型性能優(yōu)于OpenAI,，但構建成本僅為后者的一小部分,。這一聲明震驚了市場，尤其是提到其大型語言模型的訓練成本僅為560萬美元,，引發(fā)了對科技巨頭在高級AI工作負載上巨額投入的關注,。由于投資者擔心DeepSeek的影響,，英偉達的市值在周一蒸發(fā)近6000億美元,。

然而,，并非所有人都相信DeepSeek的說法,。上周，DeepSeek發(fā)布了新的推理模型R1,，宣稱可以與OpenAI的o1相媲美,。這種模型旨在以類似人類的方式處理復雜問題。DeepSeek由專注于人工智能的量化對沖基金High-Flyer聯(lián)合創(chuàng)始人梁文鋒于2023年創(chuàng)立,，專注于大型語言模型和實現(xiàn)通用人工智能（AGI）,。

R1背后的技術并不新鮮，但值得注意的是,，DeepSeek是首個將其部署到高性能AI模型中的公司,。據(jù)稱，其功耗要求大大降低,。歐亞集團地緣技術業(yè)務總監(jiān)陸曉萌認為,，這表明發(fā)展這一行業(yè)的可能性很大，而高端芯片/資本密集型方式只是其中一種技術路徑,。

DeepSeek有兩個主要系統(tǒng)：V3和R1,，都是開源的,，意味著底層代碼免費且公開。V3共有6710億個參數(shù),，相比之下,，專家估計OpenAI最新模型至少有1萬億個參數(shù)。DeepSeek表示,，R1在多個基準測試中實現(xiàn)了與o1相當?shù)男阅?。此外，V3的訓練成本僅為560萬美元,，遠低于西方競爭對手,。

不過，這些說法也受到了質疑,。The Futurum Group首席執(zhí)行官丹尼爾·紐曼表示,，雖然這是一個巨大突破，但他對具體數(shù)字持懷疑態(tài)度,。DGA Group中國區(qū)高級副總裁Paul Triolio指出,，很難直接比較DeepSeek的成本和美國主要開發(fā)商的成本，因為560萬美元僅是一次訓練運行的成本,，總體研發(fā)成本可能更高,。

DeepSeek和OpenAI都在網(wǎng)站上披露了模型計算的定價。DeepSeek每100萬個輸入標記的成本為55美分,，輸出標記為2.19美元,；而OpenAI的o1則分別為15美元和60美元。對于GPT-4o mini,，OpenAI每100萬個輸入令牌收取15美分,。

DeepSeek的聲明還引發(fā)了對其使用芯片真實性的爭論。該公司聲稱使用的是符合出口要求的Nvidia H800和A100芯片,，但一些人對此表示懷疑,。Scale AI首席執(zhí)行官Alexandr Wang認為DeepSeek可能使用了被禁芯片，不過Nvidia否認了這一說法,。

業(yè)內專家普遍認為DeepSeek取得的成就令人印象深刻,，但也有一些人對其說法表示懷疑。Oculus和Anduril的創(chuàng)始人帕爾默·盧基認為500萬美元這個數(shù)字不實,，而億萬富翁投資者維諾德·科斯拉則暗示DeepSeek可能盜用了技術,。OpenAI也在審查有關DeepSeek可能不當使用其模型數(shù)據(jù)的報告。

無論圍繞DeepSeek的爭議如何,，人工智能科學家普遍認為這是行業(yè)的一大進步,。Meta首席人工智能科學家Yann LeCun表示，這標志著開源AI模型的勝利,，而不是中國戰(zhàn)勝美國,。他認為DeepSeek受益于開放研究和開源,，這將使整個行業(yè)受益。

(責任編輯：張蕾)

關閉