“3 個(gè)領(lǐng)先模型中有 2個(gè)來自中國實(shí)驗(yàn)室?中國追趕的速度真是令人難以置信。”在美國知名技術(shù)社區(qū)Hacker News,,一位開發(fā)者如此感嘆?!爸袊鮿?chuàng)公司已展現(xiàn)出趕超美國人工智能模型的跡象,,而且他們追趕的速度比許多業(yè)內(nèi)人士預(yù)期的要快?!庇型饷?2月24日的一篇報(bào)道中,,也通過對(duì)比中美兩國AI企業(yè)推理模型的表現(xiàn)以和研發(fā)速度,得出上述結(jié)論,。
1月20日,,國內(nèi)兩家備受關(guān)注的人工智能大模型創(chuàng)業(yè)公司月之暗面(Kimi)和深度求索(DeepSeek)幾乎在同一時(shí)間發(fā)布了最新模型,都在性能測(cè)試中超過OpenAI的o1正式版模型,。
在月之暗面發(fā)布的k1.5多模態(tài)思考模型中,,多模態(tài)思考模型實(shí)現(xiàn)了SOTA級(jí)別多模態(tài)推理和通用推理能力。(注:SOTA通常指某個(gè)領(lǐng)域中最先進(jìn)的技術(shù)或方法)short-CoT模式下,,Kimi k1.5的數(shù)學(xué),、代碼、視覺多模態(tài)和通用能力,,大幅超越了全球范圍內(nèi)短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,,領(lǐng)先達(dá)到550%;而在long-CoT模式下,,Kimi k1.5的數(shù)學(xué),、代碼、多模態(tài)推理能力,,也達(dá)到長思考SOTA模型OpenAI o1正式版的水平,。
而深度求索發(fā)布的DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,,極大提升了模型推理能力,。在數(shù)學(xué)、代碼,、自然語言推理等任務(wù)上,,性能比肩OpenAI o1正式版。
不到兩個(gè)月,兩家國產(chǎn)推理模型都實(shí)現(xiàn)了對(duì)OpenAI o1正式版的對(duì)標(biāo)甚至超越,,而與OpenAI不同,,兩家中國公司都公開了他們的原理及技術(shù)報(bào)告:Kimi k1.5發(fā)布原創(chuàng)技術(shù)long2short,高效思維鏈+原生多模,,DeepSeek R1則繼續(xù)主打高性價(jià)比,。報(bào)告一出,引來大量海外從業(yè)者的解讀和關(guān)注,。
英偉達(dá)高級(jí)科學(xué)家范麟熙(Jim Fan)在社交媒體發(fā)文表示,,“兩篇論文披露了大量技術(shù)細(xì)節(jié),并驚人得出相似結(jié)論,,假期讀到令人鼓舞,。”
Answera公司創(chuàng)始人保羅·庫弗特(Paul Couvert)也感嘆,,“兩款中國o1同日發(fā)布,,中國AI追趕速度越來越快?!?/p>
中央民族大學(xué)教授郭全中表示:"中國AI公司之前基本都在摸著Open AI的石頭過河,,但從K1.5等國產(chǎn)大模型開始,以硅谷為中心的格局已悄然發(fā)生變動(dòng),。國產(chǎn)大模型的突破不僅在于技術(shù)指標(biāo)的提升,,也展示了中國AI技術(shù)正在走向自主創(chuàng)新的新階段。期待看到更多中國企業(yè)在全球AI舞臺(tái)上展現(xiàn)實(shí)力,,推動(dòng)人工智能技術(shù)向著更高水平邁進(jìn),。”
9月12日,,OpenAI在其官網(wǎng)上發(fā)布了一則公告,宣布向所有訂閱用戶推出OpenAI o1預(yù)覽模型,。這一模型被公眾廣泛關(guān)注,,昵稱為“草莓”大模型
2024-09-13 08:15:59OpenAI發(fā)布具有推理能力的AI模型o1中國AI初創(chuàng)公司深度求索(DeepSeek)在短短一個(gè)月內(nèi)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 19:35:39DeepSeek為何引發(fā)全球轟動(dòng)