“3 個領(lǐng)先模型中有 2個來自中國實驗室?中國追趕的速度真是令人難以置信?!痹诿绹夹g(shù)社區(qū)Hacker News,,一位開發(fā)者如此感嘆,。“中國初創(chuàng)公司已展現(xiàn)出趕超美國人工智能模型的跡象,,而且他們追趕的速度比許多業(yè)內(nèi)人士預(yù)期的要快,。”有外媒12月24日的一篇報道中,,也通過對比中美兩國AI企業(yè)推理模型的表現(xiàn)以和研發(fā)速度,,得出上述結(jié)論。
1月20日,,國內(nèi)兩家備受關(guān)注的人工智能大模型創(chuàng)業(yè)公司月之暗面(Kimi)和深度求索(DeepSeek)幾乎在同一時間發(fā)布了最新模型,,都在性能測試中超過OpenAI的o1正式版模型。
在月之暗面發(fā)布的k1.5多模態(tài)思考模型中,,多模態(tài)思考模型實現(xiàn)了SOTA級別多模態(tài)推理和通用推理能力,。(注:SOTA通常指某個領(lǐng)域中最先進(jìn)的技術(shù)或方法)short-CoT模式下,Kimi k1.5的數(shù)學(xué),、代碼,、視覺多模態(tài)和通用能力,大幅超越了全球范圍內(nèi)短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,,領(lǐng)先達(dá)到550%,;而在long-CoT模式下,Kimi k1.5的數(shù)學(xué),、代碼,、多模態(tài)推理能力,也達(dá)到長思考SOTA模型OpenAI o1正式版的水平,。
而深度求索發(fā)布的DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用強(qiáng)化學(xué)習(xí)技術(shù),,在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力,。在數(shù)學(xué),、代碼、自然語言推理等任務(wù)上,,性能比肩OpenAI o1正式版,。
不到兩個月,兩家國產(chǎn)推理模型都實現(xiàn)了對OpenAI o1正式版的對標(biāo)甚至超越,,而與OpenAI不同,,兩家中國公司都公開了他們的原理及技術(shù)報告:Kimi k1.5發(fā)布原創(chuàng)技術(shù)long2short,高效思維鏈+原生多模,,DeepSeek R1則繼續(xù)主打高性價比,。報告一出,引來大量海外從業(yè)者的解讀和關(guān)注,。
英偉達(dá)高級科學(xué)家范麟熙(Jim Fan)在社交媒體發(fā)文表示,,“兩篇論文披露了大量技術(shù)細(xì)節(jié),,并驚人得出相似結(jié)論,假期讀到令人鼓舞,?!?/p>
Answera公司創(chuàng)始人保羅·庫弗特(Paul Couvert)也感嘆,“兩款中國o1同日發(fā)布,,中國AI追趕速度越來越快,。”
中央民族大學(xué)教授郭全中表示:"中國AI公司之前基本都在摸著Open AI的石頭過河,,但從K1.5等國產(chǎn)大模型開始,,以硅谷為中心的格局已悄然發(fā)生變動。國產(chǎn)大模型的突破不僅在于技術(shù)指標(biāo)的提升,,也展示了中國AI技術(shù)正在走向自主創(chuàng)新的新階段,。期待看到更多中國企業(yè)在全球AI舞臺上展現(xiàn)實力,推動人工智能技術(shù)向著更高水平邁進(jìn),?!?/p>
OpenAI首席執(zhí)行官山姆·奧特曼當(dāng)?shù)貢r間1月17日在社交媒體平臺X發(fā)文稱,,OpenAI已完成新推理AI模型o3 mini版本,將在幾周內(nèi)推出
2025-01-18 11:24:13OpenAI將推出推理AI模型9月12日,,OpenAI在其官網(wǎng)上發(fā)布了一則公告,,宣布向所有訂閱用戶推出OpenAI o1預(yù)覽模型。這一模型被公眾廣泛關(guān)注,,昵稱為“草莓”大模型
2024-09-13 08:15:59OpenAI發(fā)布具有推理能力的AI模型o1OpenAI,ChatGPT的創(chuàng)造者,,正與芯片設(shè)計巨頭如博通展開合作討論,,旨在共同研發(fā)新一代人工智能芯片
2024-07-19 17:05:36OpenAI據(jù)稱正與博通等公司接洽