“3 個領(lǐng)先模型中有 2個來自中國實驗室?中國追趕的速度真是令人難以置信?!痹诿绹夹g(shù)社區(qū)Hacker News,,一位開發(fā)者如此感嘆?!爸袊鮿?chuàng)公司已展現(xiàn)出趕超美國人工智能模型的跡象,,而且他們追趕的速度比許多業(yè)內(nèi)人士預(yù)期的要快?!庇型饷?2月24日的一篇報道中,,也通過對比中美兩國AI企業(yè)推理模型的表現(xiàn)以和研發(fā)速度,得出上述結(jié)論,。
1月20日,,國內(nèi)兩家備受關(guān)注的人工智能大模型創(chuàng)業(yè)公司月之暗面(Kimi)和深度求索(DeepSeek)幾乎在同一時間發(fā)布了最新模型,都在性能測試中超過OpenAI的o1正式版模型,。
在月之暗面發(fā)布的k1.5多模態(tài)思考模型中,,多模態(tài)思考模型實現(xiàn)了SOTA級別多模態(tài)推理和通用推理能力。(注:SOTA通常指某個領(lǐng)域中最先進(jìn)的技術(shù)或方法)short-CoT模式下,,Kimi k1.5的數(shù)學(xué),、代碼、視覺多模態(tài)和通用能力,,大幅超越了全球范圍內(nèi)短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,,領(lǐng)先達(dá)到550%;而在long-CoT模式下,Kimi k1.5的數(shù)學(xué),、代碼,、多模態(tài)推理能力,也達(dá)到長思考SOTA模型OpenAI o1正式版的水平,。
而深度求索發(fā)布的DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用強化學(xué)習(xí)技術(shù),,在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力,。在數(shù)學(xué),、代碼、自然語言推理等任務(wù)上,,性能比肩OpenAI o1正式版。
不到兩個月,,兩家國產(chǎn)推理模型都實現(xiàn)了對OpenAI o1正式版的對標(biāo)甚至超越,,而與OpenAI不同,兩家中國公司都公開了他們的原理及技術(shù)報告:Kimi k1.5發(fā)布原創(chuàng)技術(shù)long2short,,高效思維鏈+原生多模,,DeepSeek R1則繼續(xù)主打高性價比。報告一出,,引來大量海外從業(yè)者的解讀和關(guān)注,。
OpenAI首席執(zhí)行官山姆·奧特曼當(dāng)?shù)貢r間1月17日在社交媒體平臺X發(fā)文稱,,OpenAI已完成新推理AI模型o3 mini版本,,將在幾周內(nèi)推出
2025-01-18 11:24:13OpenAI將推出推理AI模型9月12日,OpenAI在其官網(wǎng)上發(fā)布了一則公告,,宣布向所有訂閱用戶推出OpenAI o1預(yù)覽模型,。這一模型被公眾廣泛關(guān)注,昵稱為“草莓”大模型
2024-09-13 08:15:59OpenAI發(fā)布具有推理能力的AI模型o1OpenAI,,ChatGPT的創(chuàng)造者,正與芯片設(shè)計巨頭如博通展開合作討論,,旨在共同研發(fā)新一代人工智能芯片
2024-07-19 17:05:36OpenAI據(jù)稱正與博通等公司接洽