DeepSeek R1的推出給全球AI行業(yè)帶來了新的變數(shù)。面對這一沖擊,美國兩大AI巨頭Anthropic與OpenAI迅速做出回應,,試圖緩解市場對其技術領先地位的擔憂,。
周三,Anthropic首席執(zhí)行官達里奧·阿莫迪發(fā)布了一篇長文討論了DeepSeek的進展,。他指出,,DeepSeek并沒有“用600萬美元做到美國AI公司花費數(shù)十億美元才能實現(xiàn)的事情”。以Anthropic為例,,Claude 3.5 Sonnet是一個中等規(guī)模的模型,,訓練成本達數(shù)千萬美元,遠非數(shù)十億美元級別,。他認為DeepSeek的訓練成本降低符合行業(yè)趨勢,,并不代表突破性的技術成就。如果AI訓練成本每年下降4倍,,而DeepSeek-V3的訓練成本比一年前開發(fā)的美國當前模型低約8倍,,這完全符合正常趨勢。即使接受DeepSeek的訓練成本數(shù)據(jù),,他們也只是處于趨勢線上,,甚至可能還未完全達到。
此前一天,,OpenAI首席研究員Mark Chen也對DeepSeek R1做出回應,,其態(tài)度既肯定又帶有一絲微妙。Chen承認DeepSeek“獨立發(fā)現(xiàn)了OpenAI在o1模型研發(fā)過程中的一些核心理念”,,但他將焦點轉移到成本問題上,,認為“外界對成本優(yōu)勢的解讀有些過頭”,。他還提到了“蒸餾技術”的成熟和“成本與能力解耦”的趨勢,強調OpenAI在模型壓縮和優(yōu)化技術方面的探索,。他表示,,低成本服務模型并不意味著擁有更強的模型能力。OpenAI將繼續(xù)在降低成本和提升能力兩個方向上努力,,并承諾今年會發(fā)布更優(yōu)秀的模型,。
紐約大學教授、AI專家Gary Marcus則認為,,DeepSeek對OpenAI的影響可能比想象中更大,。他指出,DeepSeek基本上免費提供了OpenAI想要收費的東西,,這可能會嚴重影響OpenAI的商業(yè)模式,。此外,DeepSeek比OpenAI更開放,,這將吸引更多人才,。Marcus質疑OpenAI 1570億美元的估值,在每年損失約50億美元的情況下,,這一估值難以證明合理性,。
阿莫迪進一步解釋了AI發(fā)展的三大定律:規(guī)模法則、計算成本的下降和訓練范式的變化,。規(guī)模法則表明,,訓練規(guī)模越大,AI在一系列認知任務上的表現(xiàn)越穩(wěn)定,、越出色,。計算成本的下降則是由于算法和硬件的改進,使得AI訓練的計算成本每年下降約4倍,。訓練范式的改變則體現(xiàn)在從預訓練到強化學習的發(fā)展,。這些因素有助于理解DeepSeek最近的發(fā)布。盡管DeepSeek在某些方面表現(xiàn)出色,,但并未從根本上改變LLM的經(jīng)濟性,,它只是持續(xù)成本降低曲線上一個預期的點。不同的是,,這次第一個展示預期成本降低的公司是中國的,,這在地緣政治上具有重要意義。美國公司很快也會跟上這一趨勢,。
盡管像ChatGPT這樣的大語言模型一直是AI新聞的焦點,,但人們開始意識到它們的局限性,。OpenAI表示其旗艦GPT模型的改進速度正在放緩,,這引發(fā)了對未來發(fā)展方向的疑問
2024-11-26 11:17:00科技巨頭開始“卷”AI智能體1月27日,,DeepSeek應用登頂蘋果美國地區(qū)應用商店免費APP下載排行榜,超越了ChatGPT,。同一天,,該應用也在中國區(qū)蘋果應用商店的免費榜上位列第一
2025-01-27 09:12:14DeepSeek登頂蘋果美區(qū)免費下載榜