一則消息突然引爆市場,。今日,小米集團股價一度大漲超過5%,,金山云漲幅更是超過了18%,。小米大模型微信公眾號宣布,小米開源了首個專為推理設計的大模型“Xiaomi MiMo”,,該模型從預訓練到后訓練全面提升了推理能力,。
當前,AI大模型的競爭再度進入白熱化階段。4月29日,,阿里巴巴通義千問發(fā)布了新版Qwen 3系列模型。同一天,,馬斯克也宣布將在下周向SuperGrok訂閱者發(fā)布Grok 3.5的早期測試版,。
券商機構分析指出,國內(nèi)外大模型能力差距正在縮小,,國產(chǎn)算力芯片持續(xù)進步,,國內(nèi)頭部互聯(lián)網(wǎng)廠商加大資本支出,為國內(nèi)AI的發(fā)展奠定了基礎,。隨著國內(nèi)外巨頭大模型的不斷迭代,,消費者端或有望迎來殺手級應用。
4月30日,,小米系股票全線拉升,,小米集團盤中一度上漲超過5%,金山云漲幅超過18%,,金山軟件最高漲超6%,。港股云計算板塊同樣表現(xiàn)強勁,金蝶國際,、中國軟件國際和阿里巴巴-W等公司股價均有不同程度的上漲,。
據(jù)“小米大模型”公眾號消息,MiMo在數(shù)學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,,以7B參數(shù)規(guī)模超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開源推理模型QwQ-32B-Preview,。官方稱,在相同強化學習訓練數(shù)據(jù)情況下,,MiMo-7B在數(shù)學與代碼領域的表現(xiàn)顯著領先,。目前,MiMo-7B全系列模型已在HuggingFace平臺開源,,并發(fā)布了詳細技術報告,。
小米技術團隊表示,MiMo的核心突破在于預訓練與后訓練階段的協(xié)同優(yōu)化,。在預訓練階段,,通過挖掘高質(zhì)量推理語料并合成約2000億tokens專項數(shù)據(jù),采用三階段漸進訓練策略,,累計訓練量達25萬億tokens,。后訓練階段則引入創(chuàng)新強化學習技術,包括自研算法和策略,,有效提升模型在復雜任務中的穩(wěn)定性,。技術團隊還開發(fā)了“Seamless Rollout”系統(tǒng),使訓練效率大幅提升。
值得注意的是,,就在小米宣布“Xiaomi Mimo”開源前,阿里巴巴通義千問于4月29日凌晨發(fā)布了新版Qwen 3系列模型,,包括2個MoE模型和6個dense模型,。通義千問表示,Qwen 3在多個權威評測中表現(xiàn)出色,,實現(xiàn)了“小而強大”的目標,。Qwen 3融合了推理與非推理能力,在邏輯分析和創(chuàng)意生成等任務中表現(xiàn)卓越,。
馬斯克也在社交平臺上宣布,,下周將向SuperGrok訂閱者發(fā)布Grok 3.5的早期測試版,這是第一個能夠準確回答有關火箭發(fā)動機或電化學技術問題的人工智能,。全球AI大模型的競爭愈發(fā)激烈,,過去119天內(nèi),中美十家主要大模型公司發(fā)布了14款基礎大模型,。國際市場調(diào)研機構Artificial Analysis發(fā)布的報告顯示,,美國大模型雖然目前仍領先,但中國的差距正在不斷縮小,。
西部證券認為,,AI大模型能力提升和使用成本下降是主旋律,多模態(tài)或逐步成為未來基礎模型的標準配置,,進一步拉動算力需求,。開源證券看好AI Agent的應用前景,預計AI Agent將在電商,、營銷、CRM,、金融,、法律等多個場景加速落地,。天風證券表示,通義千問體系在模型能力,、硬件能力和生態(tài)建設上保持領先,已實現(xiàn)全模態(tài)覆蓋,,成為全球最大模型開源生態(tài),。
日韓股市高開,,日經(jīng)225指數(shù)開盤上漲0.9%,,報38046.97點,個股普漲韓國KOSPI指數(shù)開盤上漲0.8%,,報2691.06點
2025-05-29 11:35:07日韓股市全線大漲當?shù)貢r間1月15日,美股三大指數(shù)收漲,,道瓊斯工業(yè)指數(shù)上漲1.65%,,標普500指數(shù)上漲1.83%,,納斯達克指數(shù)上漲2.45%
2025-01-16 09:33:14兩次熔斷