一則消息突然引爆市場(chǎng)。今日,小米集團(tuán)股價(jià)一度大漲超過(guò)5%,,金山云漲幅更是超過(guò)了18%,。小米大模型微信公眾號(hào)宣布,小米開源了首個(gè)專為推理設(shè)計(jì)的大模型“Xiaomi MiMo”,該模型從預(yù)訓(xùn)練到后訓(xùn)練全面提升了推理能力。
當(dāng)前,AI大模型的競(jìng)爭(zhēng)再度進(jìn)入白熱化階段,。4月29日,阿里巴巴通義千問(wèn)發(fā)布了新版Qwen 3系列模型,。同一天,,馬斯克也宣布將在下周向SuperGrok訂閱者發(fā)布Grok 3.5的早期測(cè)試版。
券商機(jī)構(gòu)分析指出,,國(guó)內(nèi)外大模型能力差距正在縮小,,國(guó)產(chǎn)算力芯片持續(xù)進(jìn)步,國(guó)內(nèi)頭部互聯(lián)網(wǎng)廠商加大資本支出,,為國(guó)內(nèi)AI的發(fā)展奠定了基礎(chǔ),。隨著國(guó)內(nèi)外巨頭大模型的不斷迭代,消費(fèi)者端或有望迎來(lái)殺手級(jí)應(yīng)用,。
4月30日,,小米系股票全線拉升,小米集團(tuán)盤中一度上漲超過(guò)5%,,金山云漲幅超過(guò)18%,,金山軟件最高漲超6%。港股云計(jì)算板塊同樣表現(xiàn)強(qiáng)勁,,金蝶國(guó)際,、中國(guó)軟件國(guó)際和阿里巴巴-W等公司股價(jià)均有不同程度的上漲。
據(jù)“小米大模型”公眾號(hào)消息,,MiMo在數(shù)學(xué)推理(AIME 24-25)和代碼競(jìng)賽(LiveCodeBench v5)公開測(cè)評(píng)集上,以7B參數(shù)規(guī)模超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開源推理模型QwQ-32B-Preview,。官方稱,,在相同強(qiáng)化學(xué)習(xí)訓(xùn)練數(shù)據(jù)情況下,MiMo-7B在數(shù)學(xué)與代碼領(lǐng)域的表現(xiàn)顯著領(lǐng)先,。目前,,MiMo-7B全系列模型已在HuggingFace平臺(tái)開源,,并發(fā)布了詳細(xì)技術(shù)報(bào)告。
小米技術(shù)團(tuán)隊(duì)表示,,MiMo的核心突破在于預(yù)訓(xùn)練與后訓(xùn)練階段的協(xié)同優(yōu)化,。在預(yù)訓(xùn)練階段,通過(guò)挖掘高質(zhì)量推理語(yǔ)料并合成約2000億tokens專項(xiàng)數(shù)據(jù),,采用三階段漸進(jìn)訓(xùn)練策略,,累計(jì)訓(xùn)練量達(dá)25萬(wàn)億tokens。后訓(xùn)練階段則引入創(chuàng)新強(qiáng)化學(xué)習(xí)技術(shù),,包括自研算法和策略,,有效提升模型在復(fù)雜任務(wù)中的穩(wěn)定性。技術(shù)團(tuán)隊(duì)還開發(fā)了“Seamless Rollout”系統(tǒng),,使訓(xùn)練效率大幅提升,。
值得注意的是,就在小米宣布“Xiaomi Mimo”開源前,,阿里巴巴通義千問(wèn)于4月29日凌晨發(fā)布了新版Qwen 3系列模型,,包括2個(gè)MoE模型和6個(gè)dense模型。通義千問(wèn)表示,,Qwen 3在多個(gè)權(quán)威評(píng)測(cè)中表現(xiàn)出色,,實(shí)現(xiàn)了“小而強(qiáng)大”的目標(biāo)。Qwen 3融合了推理與非推理能力,,在邏輯分析和創(chuàng)意生成等任務(wù)中表現(xiàn)卓越,。
馬斯克也在社交平臺(tái)上宣布,下周將向SuperGrok訂閱者發(fā)布Grok 3.5的早期測(cè)試版,,這是第一個(gè)能夠準(zhǔn)確回答有關(guān)火箭發(fā)動(dòng)機(jī)或電化學(xué)技術(shù)問(wèn)題的人工智能,。全球AI大模型的競(jìng)爭(zhēng)愈發(fā)激烈,過(guò)去119天內(nèi),,中美十家主要大模型公司發(fā)布了14款基礎(chǔ)大模型,。國(guó)際市場(chǎng)調(diào)研機(jī)構(gòu)Artificial Analysis發(fā)布的報(bào)告顯示,美國(guó)大模型雖然目前仍領(lǐng)先,,但中國(guó)的差距正在不斷縮小,。
西部證券認(rèn)為,AI大模型能力提升和使用成本下降是主旋律,,多模態(tài)或逐步成為未來(lái)基礎(chǔ)模型的標(biāo)準(zhǔn)配置,,進(jìn)一步拉動(dòng)算力需求。開源證券看好AI Agent的應(yīng)用前景,,預(yù)計(jì)AI Agent將在電商,、營(yíng)銷、CRM、金融,、法律等多個(gè)場(chǎng)景加速落地,。天風(fēng)證券表示,通義千問(wèn)體系在模型能力,、硬件能力和生態(tài)建設(shè)上保持領(lǐng)先,,已實(shí)現(xiàn)全模態(tài)覆蓋,成為全球最大模型開源生態(tài),。