農(nóng)歷除夕夜,,全球華人喜迎新春之時(shí),,紐約證券交易所的電子屏上,,阿里巴巴美股股價(jià)在收盤(pán)前從漲幅1%快速拉升至6.7%,。這一行情異動(dòng)背后,是一場(chǎng)技術(shù)上的奇襲,。
1月29日凌晨,,阿里通義千問(wèn)團(tuán)隊(duì)悄然上線了大模型Qwen2.5-Max,,在多個(gè)權(quán)威基準(zhǔn)測(cè)試中展現(xiàn)出與全球頂級(jí)模型比肩的性能,。這是繼DeepSeek之后,,中國(guó)AI陣營(yíng)在高性能、低成本技術(shù)路線上的又一重要突破,。
市場(chǎng)人士分析稱(chēng),此前過(guò)度聚焦DeepSeek,,卻忽視了包括阿里通義在內(nèi)的中國(guó)AI整體性追趕,。行業(yè)媒體《信息平權(quán)》表示,若阿里Qwen-2.5-max的性能超過(guò)V3,,可以對(duì)其RL推理模型給予更大期待,。
當(dāng)阿里云展現(xiàn)出“強(qiáng)大模型+充足算力+完整云平臺(tái)”的組合優(yōu)勢(shì)時(shí),是否印證了類(lèi)似去年北美云計(jì)算服務(wù)商的投資邏輯,?如果美股因AI整體增值10萬(wàn)億美元,,中國(guó)AI資產(chǎn)的重估時(shí)機(jī)是否已至?
Qwen2.5-Max采用超大規(guī)模MoE(混合專(zhuān)家)架構(gòu),,基于超過(guò)20萬(wàn)億token的預(yù)訓(xùn)練數(shù)據(jù),。在MMLU-Pro,、LiveCodeBench、LiveBench以及Arena-Hard等多個(gè)權(quán)威評(píng)測(cè)中,,該模型均展現(xiàn)出與DeepSeek V3,、GPT-4和Claude-3.5-Sonnet比肩甚至領(lǐng)先的性能。阿里團(tuán)隊(duì)表示,,隨著后訓(xùn)練技術(shù)的進(jìn)步,,下一個(gè)版本將有望達(dá)到更高水平。
Qwen2.5團(tuán)隊(duì)同步發(fā)布了兩個(gè)創(chuàng)新型號(hào):Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m,。這些開(kāi)源模型支持高達(dá)100萬(wàn)token的上下文窗口,,成為業(yè)內(nèi)首個(gè)達(dá)到此規(guī)模的公開(kāi)可用模型。這些模型使用稀疏注意力,,處理百萬(wàn)token輸入的速度比傳統(tǒng)方法快3到7倍,,輸出長(zhǎng)度可達(dá)8000個(gè)token。
在測(cè)試中,,14B型號(hào)和Qwen2.5-Turbo在查找非常長(zhǎng)的文檔中的隱藏?cái)?shù)字時(shí)都達(dá)到了完美的準(zhǔn)確性,。較小的7B型號(hào)也表現(xiàn)良好,只有輕微的錯(cuò)誤,。在RULER,、LV-Eval和LongbenchChat等要求更高的復(fù)雜的上下文測(cè)試中,百萬(wàn)token模型的表現(xiàn)優(yōu)于128K token模型,,尤其是在超過(guò)64K token的序列中,,14B型號(hào)甚至在RULER中得分超過(guò)90分——這是Qwen系列的第一次——在多個(gè)數(shù)據(jù)集上持續(xù)擊敗gpt - 4o mini。
如果說(shuō)DeepSeek V3展現(xiàn)了中國(guó)AI的銳度,,那么阿里的突破則體現(xiàn)了產(chǎn)業(yè)生態(tài)的深度進(jìn)化,。Qwen2.5-Max發(fā)布當(dāng)天,阿里云百煉平臺(tái)同步開(kāi)放了完整的工具鏈支持,,開(kāi)發(fā)者可以直接在云端調(diào)用,。這種“超算集群+開(kāi)源生態(tài)+云原生”的三位一體架構(gòu),與北美AWS,、Azure,、GCP三大云服務(wù)商的商業(yè)模式形成鏡像。
摩根士丹利最新研報(bào)指出,,低成本高性能模型也將重塑數(shù)據(jù)中心和軟件行業(yè)格局,。對(duì)于中國(guó)數(shù)據(jù)中心而言,短期內(nèi),,如果大型科技公司采用類(lèi)似技術(shù)路線,,可能減少AI訓(xùn)練相關(guān)需求。但從長(zhǎng)遠(yuǎn)來(lái)看,,低成本模型將推動(dòng)推理需求增長(zhǎng),,對(duì)一線城市數(shù)據(jù)中心形成利好,。對(duì)于中國(guó)軟件行業(yè),AI模型成本的降低將降低應(yīng)用程序運(yùn)行AI功能的門(mén)檻,,從供給側(cè)改善行業(yè)環(huán)境,。
如果阿里Qwen-2.5-max的性能確實(shí)展現(xiàn)出預(yù)期水平,加之其低成本優(yōu)勢(shì)與完整云生態(tài),,或引發(fā)中國(guó)AI資產(chǎn)的新一輪重估,。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外ChatGPT面市兩周年前夕,有消息稱(chēng)OpenAI計(jì)劃推出下一代前沿旗艦?zāi)P蚈rion
2024-10-26 00:11:04奧爾特曼辟謠OpenAI新模型消息根據(jù)中國(guó)結(jié)算的安排,,對(duì)于10月1日(周二)至10月8日(周二)提交申請(qǐng)的新開(kāi)證券賬戶,,于10月9日(周三)起可用于交易。
2024-10-09 10:15:05今天