春節(jié)期間,,DeepSeek成為當之無愧的春節(jié)頂流,,熱度持續(xù)高漲,。在面臨巨頭企業(yè)支持和多國政府質(zhì)疑的復雜局勢下,,OpenAI緊急推出了全新的推理模型o3-mini,,并首次向所有用戶免費提供該模型,。不過,,o3-mini的API定價仍高于DeepSeek模型,。
o3-mini發(fā)布后,,OpenAI CEO薩姆·阿爾特曼在Reddit上表示,,他們將學習DeepSeek公開推理模型思考過程的做法,并重新考慮其閉源策略,。他承認OpenAI的領先優(yōu)勢已不如從前,。與此同時,華為云宣布與硅基流動聯(lián)合推出基于華為云昇騰云服務的DeepSeek R1/V3推理服務,。
SemiAnalysis的一項新報告揭示了DeepSeek成功的關(guān)鍵因素:擁有至少5萬塊Hopper架構(gòu)的GPU,,投資超過5億美元;預訓練成本僅為600萬美元,,但不包括硬件研發(fā)和總體擁有成本,;為有前途的候選人提供超過130萬美元的年薪;關(guān)鍵創(chuàng)新多頭潛注意力技術(shù)顯著降低了推理價格,。
英偉達創(chuàng)始人兼CEO黃仁勛被緊急召進美國白宮,,與美國總統(tǒng)討論了DeepSeek以及收緊AI芯片出口的問題。特朗普認為這家中國公司的出現(xiàn)意味著“美國公司不必花費大量資金來構(gòu)建低成本AI替代品”,。政府計劃在今年春天進一步限制AI芯片出口,,以確保美國及其盟友繼續(xù)擁有先進的計算能力。
上線18天的DeepSeek日活達到1500萬,,增速是ChatGPT的13倍,。目前,DeepSeek依然霸榜,,位列蘋果應用商店157個國家/地區(qū)的第一名,。Meta首席科學家楊立昆認為硅谷圈子中的“常見病”是錯位的優(yōu)越感,導致對其他地方創(chuàng)新的懷疑,。
阿爾特曼稱贊DeepSeek是一個非常好的模型,,并表示OpenAI將保持比往年更少的領先優(yōu)勢,。OpenAI計劃展示更多模型的思考過程,,并透露了一些新研究進展,如圖像生成功能,、高級語音更新,、文件附加功能等。
DeepSeek的成功在于其大規(guī)模利用多標記預測、混合專家模型和多頭潛在注意力技術(shù),。這些創(chuàng)新顯著降低了推理成本,,使得DeepSeek能夠在短時間內(nèi)迅速崛起。未來,,隨著研發(fā)人員進一步優(yōu)化這一新模式,,不同模型之間的能力差距可能會進一步拉大。
DeepSeek的發(fā)布對整個行業(yè)產(chǎn)生了深遠影響,,改變了中美之間的AI競爭格局,。中國企業(yè)在開源領域的積極作為,促使美國重新審視其限制開源的策略,。DeepSeek的橫空出世重塑了全球AI產(chǎn)業(yè)的競爭版圖,,各國可能需要重新審視AI發(fā)展戰(zhàn)略,加強投入和合作,,共同推動AI技術(shù)的進步,。