中國(guó)2家AI公司連發(fā)新模型趕超OpenAI 美開發(fā)者：中國(guó)追趕的速度令人難以置信

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-24 09:39:00 中國(guó)網(wǎng)科技

“3 個(gè)領(lǐng)先模型中有 2個(gè)來(lái)自中國(guó)實(shí)驗(yàn)室?中國(guó)追趕的速度真是令人難以置信,。”在美國(guó)知名技術(shù)社區(qū)Hacker News,，一位開發(fā)者如此感嘆,。“中國(guó)初創(chuàng)公司已展現(xiàn)出趕超美國(guó)人工智能模型的跡象,，而且他們追趕的速度比許多業(yè)內(nèi)人士預(yù)期的要快,。”有外媒12月24日的一篇報(bào)道中,，也通過(guò)對(duì)比中美兩國(guó)AI企業(yè)推理模型的表現(xiàn)以和研發(fā)速度,，得出上述結(jié)論。

1月20日,，國(guó)內(nèi)兩家備受關(guān)注的人工智能大模型創(chuàng)業(yè)公司月之暗面(Kimi)和深度求索(DeepSeek)幾乎在同一時(shí)間發(fā)布了最新模型,，都在性能測(cè)試中超過(guò)OpenAI的o1正式版模型。

在月之暗面發(fā)布的k1.5多模態(tài)思考模型中,，多模態(tài)思考模型實(shí)現(xiàn)了SOTA級(jí)別多模態(tài)推理和通用推理能力,。(注：SOTA通常指某個(gè)領(lǐng)域中最先進(jìn)的技術(shù)或方法)short-CoT模式下，Kimi k1.5的數(shù)學(xué),、代碼,、視覺(jué)多模態(tài)和通用能力，大幅超越了全球范圍內(nèi)短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,，領(lǐng)先達(dá)到550%,；而在long-CoT模式下，Kimi k1.5的數(shù)學(xué),、代碼,、多模態(tài)推理能力，也達(dá)到長(zhǎng)思考SOTA模型OpenAI o1正式版的水平,。

而深度求索發(fā)布的DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用強(qiáng)化學(xué)習(xí)技術(shù),，在僅有極少標(biāo)注數(shù)據(jù)的情況下，極大提升了模型推理能力,。在數(shù)學(xué),、代碼、自然語(yǔ)言推理等任務(wù)上,，性能比肩OpenAI o1正式版,。

不到兩個(gè)月，兩家國(guó)產(chǎn)推理模型都實(shí)現(xiàn)了對(duì)OpenAI o1正式版的對(duì)標(biāo)甚至超越,，而與OpenAI不同,，兩家中國(guó)公司都公開了他們的原理及技術(shù)報(bào)告：Kimi k1.5發(fā)布原創(chuàng)技術(shù)long2short,，高效思維鏈+原生多模，DeepSeek R1則繼續(xù)主打高性價(jià)比,。報(bào)告一出,，引來(lái)大量海外從業(yè)者的解讀和關(guān)注,。

英偉達(dá)高級(jí)科學(xué)家范麟熙(Jim Fan)在社交媒體發(fā)文表示,，“兩篇論文披露了大量技術(shù)細(xì)節(jié),，并驚人得出相似結(jié)論,，假期讀到令人鼓舞,?！?/p>

Answera公司創(chuàng)始人保羅·庫(kù)弗特(Paul Couvert)也感嘆,，“兩款中國(guó)o1同日發(fā)布,，中國(guó)AI追趕速度越來(lái)越快,?！?/p>

中央民族大學(xué)教授郭全中表示："中國(guó)AI公司之前基本都在摸著Open AI的石頭過(guò)河,，但從K1.5等國(guó)產(chǎn)大模型開始，以硅谷為中心的格局已悄然發(fā)生變動(dòng),。國(guó)產(chǎn)大模型的突破不僅在于技術(shù)指標(biāo)的提升,，也展示了中國(guó)AI技術(shù)正在走向自主創(chuàng)新的新階段,。期待看到更多中國(guó)企業(yè)在全球AI舞臺(tái)上展現(xiàn)實(shí)力,，推動(dòng)人工智能技術(shù)向著更高水平邁進(jìn)?！?/p>

(責(zé)任編輯：盧其龍 CN070)

關(guān)閉

中國(guó)2家AI公司連發(fā)新模型趕超OpenAI 美開發(fā)者：中國(guó)追趕的速度令人難以置信

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)