中國AI模型DeepSeek引發(fā)了全球討論熱潮,持續(xù)近半個月后,美國OpenAI公司推出了新的AI推理模型o3-mini作為回應。北京時間2月1日凌晨,,OpenAI CEO奧爾特曼在ChatGPT和API服務中發(fā)布了o3-mini,。該模型的性能響應速度比之前的o1-mini提升了24%,,答案準確性也有所提高,。
目前,,ChatGPT免費用戶可以體驗一個有限速率的o3-mini版本,,而Plus用戶可選擇更高智能版本o3-mini-high,;每月支付200美元的Pro用戶則可無限使用這兩個版本。在API層面,,o3-mini的價格比o1-mini便宜63%,,但仍比GPT-4o mini貴7倍左右。
OpenAI表示,,o3-mini的發(fā)布標志著高效能智能技術(shù)道路上的重要里程碑,。通過優(yōu)化科學、技術(shù)和工程領(lǐng)域的推理能力,,同時保持較低的成本,,高質(zhì)量AI技術(shù)變得更加平易近人。
過去一周內(nèi),,DeepSeek R1和V3兩款開源AI模型顛覆了世界對于“尺度定律”的看法,。其優(yōu)異表現(xiàn)以及低成本令OpenAI內(nèi)部震動,并引發(fā)華爾街對算力成本投入的質(zhì)疑,。據(jù)SemiAnalysis報道,,DeepSeek擁有6萬張英偉達GPU卡,總體擁有成本超過140億元人民幣,。這使得英偉達股價一夜暴跌17%,,損失近6000億美元市值。
最新消息顯示,,OpenAI正在進行新一輪400億美元的融資,,軟銀將領(lǐng)投,公司估值高達3000億美元,。與此同時,,奧特曼承認OpenAI在開源方面曾站在歷史錯誤的一邊,正在考慮不同的開源策略,。
回顧過去四年,,DeepSeek創(chuàng)始人梁文鋒帶領(lǐng)團隊深入研發(fā)大模型。由于背后有幻方量化支持,,DeepSeek不缺資金且不追求商業(yè)化,。人才方面,DeepSeek提供高額年薪吸引頂尖人才,注重能力和求知欲,?;谶@種模式,DeepSeek以較低成本實現(xiàn)了高性能的AI模型訓練,。
清華大學計算機系教授翟季冬認為,,DeepSeek在算法和系統(tǒng)軟件層次做了許多創(chuàng)新,對中國未來發(fā)展AI產(chǎn)業(yè)至關(guān)重要,。如今,,o3 mini和DeepSeek R1都使用大量監(jiān)督微調(diào)、強化學習等技術(shù),,展示了稀疏化MoE架構(gòu)的重要性,。
整體來看,算法的進步使得模型訓練成本大幅降低,,同時提高了模型的能力,。Anthropic首席執(zhí)行官Dario Amodei認為,算法的進步可以帶來10倍的改進,,GPT-3質(zhì)量的推理定價已下降1200倍,。
OpenAI發(fā)布的o3-mini模型在價格和性能上具有競爭力,多項技術(shù)能力超越了DeepSeek R1,。奧爾特曼首次正面承認OpenAI的閉源是一個錯誤,,并計劃將某些模型進行開源。此外,,o3-mini模型在科學,、數(shù)學和編碼方面表現(xiàn)出色,測試人員更喜歡其回答,。
然而,,DeepSeek正面臨美國政企各方面的調(diào)查壓力。微軟和OpenAI開始調(diào)查DeepSeek是否采用其數(shù)據(jù),,美國總統(tǒng)特朗普警告稱需要限制對華AI半導體出口,。Dario Amodei認為,DeepSeek的突破迫使美國重新評估技術(shù)封鎖政策的有效性,。
中歐國際工商學院教授譚寅亮表示,,DeepSeek的成功依賴于高效的算力調(diào)度和模型優(yōu)化能力,而非單純堆積硬件資源,。中國在應用層面和用戶體驗上有強大創(chuàng)新能力,,但在底層技術(shù)上仍需追趕美國。