“3 個(gè)領(lǐng)先模型中有 2個(gè)來(lái)自中國(guó)實(shí)驗(yàn)室?中國(guó)追趕的速度真是令人難以置信,。”在美國(guó)知名技術(shù)社區(qū)Hacker News,,一位開發(fā)者如此感嘆,。“中國(guó)初創(chuàng)公司已展現(xiàn)出趕超美國(guó)人工智能模型的跡象,,而且他們追趕的速度比許多業(yè)內(nèi)人士預(yù)期的要快,。”有外媒12月24日的一篇報(bào)道中,,也通過(guò)對(duì)比中美兩國(guó)AI企業(yè)推理模型的表現(xiàn)以和研發(fā)速度,,得出上述結(jié)論。
1月20日,,國(guó)內(nèi)兩家備受關(guān)注的人工智能大模型創(chuàng)業(yè)公司月之暗面(Kimi)和深度求索(DeepSeek)幾乎在同一時(shí)間發(fā)布了最新模型,,都在性能測(cè)試中超過(guò)OpenAI的o1正式版模型。
在月之暗面發(fā)布的k1.5多模態(tài)思考模型中,,多模態(tài)思考模型實(shí)現(xiàn)了SOTA級(jí)別多模態(tài)推理和通用推理能力,。(注:SOTA通常指某個(gè)領(lǐng)域中最先進(jìn)的技術(shù)或方法)short-CoT模式下,Kimi k1.5的數(shù)學(xué),、代碼,、視覺(jué)多模態(tài)和通用能力,大幅超越了全球范圍內(nèi)短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,,領(lǐng)先達(dá)到550%,;而在long-CoT模式下,Kimi k1.5的數(shù)學(xué),、代碼,、多模態(tài)推理能力,也達(dá)到長(zhǎng)思考SOTA模型OpenAI o1正式版的水平,。
而深度求索發(fā)布的DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用強(qiáng)化學(xué)習(xí)技術(shù),,在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力,。在數(shù)學(xué),、代碼、自然語(yǔ)言推理等任務(wù)上,,性能比肩OpenAI o1正式版,。
不到兩個(gè)月,兩家國(guó)產(chǎn)推理模型都實(shí)現(xiàn)了對(duì)OpenAI o1正式版的對(duì)標(biāo)甚至超越,,而與OpenAI不同,,兩家中國(guó)公司都公開了他們的原理及技術(shù)報(bào)告:Kimi k1.5發(fā)布原創(chuàng)技術(shù)long2short,,高效思維鏈+原生多模,DeepSeek R1則繼續(xù)主打高性價(jià)比,。報(bào)告一出,,引來(lái)大量海外從業(yè)者的解讀和關(guān)注,。
英偉達(dá)高級(jí)科學(xué)家范麟熙(Jim Fan)在社交媒體發(fā)文表示,,“兩篇論文披露了大量技術(shù)細(xì)節(jié),,并驚人得出相似結(jié)論,,假期讀到令人鼓舞,?!?/p>
Answera公司創(chuàng)始人保羅·庫(kù)弗特(Paul Couvert)也感嘆,,“兩款中國(guó)o1同日發(fā)布,,中國(guó)AI追趕速度越來(lái)越快,?!?/p>
中央民族大學(xué)教授郭全中表示:"中國(guó)AI公司之前基本都在摸著Open AI的石頭過(guò)河,,但從K1.5等國(guó)產(chǎn)大模型開始,以硅谷為中心的格局已悄然發(fā)生變動(dòng),。國(guó)產(chǎn)大模型的突破不僅在于技術(shù)指標(biāo)的提升,,也展示了中國(guó)AI技術(shù)正在走向自主創(chuàng)新的新階段,。期待看到更多中國(guó)企業(yè)在全球AI舞臺(tái)上展現(xiàn)實(shí)力,,推動(dòng)人工智能技術(shù)向著更高水平邁進(jìn)?!?/p>
9月12日,,OpenAI在其官網(wǎng)上發(fā)布了一則公告,宣布向所有訂閱用戶推出OpenAI o1預(yù)覽模型,。這一模型被公眾廣泛關(guān)注,,昵稱為“草莓”大模型
2024-09-13 08:15:59OpenAI發(fā)布具有推理能力的AI模型o1中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)在短短一個(gè)月內(nèi)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 19:35:39DeepSeek為何引發(fā)全球轟動(dòng)