阿里除夕夜拋出重磅新模型 Qwen2.5-Max性能驚艷

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-29 23:11:26 華爾街見(jiàn)聞

農(nóng)歷除夕夜,，全球華人喜迎新春之時(shí),，紐約證券交易所的電子屏上，阿里巴巴美股股價(jià)在收盤(pán)前從漲幅1%快速拉升至6.7%,。這一行情異動(dòng)背后,，是一場(chǎng)技術(shù)上的奇襲。

1月29日凌晨,，阿里通義千問(wèn)團(tuán)隊(duì)悄然上線了大模型Qwen2.5-Max,，在多個(gè)權(quán)威基準(zhǔn)測(cè)試中展現(xiàn)出與全球頂級(jí)模型比肩的性能。這是繼DeepSeek之后,，中國(guó)AI陣營(yíng)在高性能,、低成本技術(shù)路線上的又一重要突破。

市場(chǎng)人士分析稱,，此前過(guò)度聚焦DeepSeek,，卻忽視了包括阿里通義在內(nèi)的中國(guó)AI整體性追趕。行業(yè)媒體《信息平權(quán)》表示,，若阿里Qwen-2.5-max的性能超過(guò)V3,，可以對(duì)其RL推理模型給予更大期待。

當(dāng)阿里云展現(xiàn)出“強(qiáng)大模型+充足算力+完整云平臺(tái)”的組合優(yōu)勢(shì)時(shí),，是否印證了類(lèi)似去年北美云計(jì)算服務(wù)商的投資邏輯,？如果美股因AI整體增值10萬(wàn)億美元，中國(guó)AI資產(chǎn)的重估時(shí)機(jī)是否已至,？

Qwen2.5-Max采用超大規(guī)模MoE（混合專家）架構(gòu),，基于超過(guò)20萬(wàn)億token的預(yù)訓(xùn)練數(shù)據(jù)。在MMLU-Pro,、LiveCodeBench,、LiveBench以及Arena-Hard等多個(gè)權(quán)威評(píng)測(cè)中，該模型均展現(xiàn)出與DeepSeek V3,、GPT-4和Claude-3.5-Sonnet比肩甚至領(lǐng)先的性能,。阿里團(tuán)隊(duì)表示，隨著后訓(xùn)練技術(shù)的進(jìn)步,，下一個(gè)版本將有望達(dá)到更高水平,。

Qwen2.5團(tuán)隊(duì)同步發(fā)布了兩個(gè)創(chuàng)新型號(hào)：Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。這些開(kāi)源模型支持高達(dá)100萬(wàn)token的上下文窗口,，成為業(yè)內(nèi)首個(gè)達(dá)到此規(guī)模的公開(kāi)可用模型,。這些模型使用稀疏注意力，處理百萬(wàn)token輸入的速度比傳統(tǒng)方法快3到7倍,，輸出長(zhǎng)度可達(dá)8000個(gè)token,。

在測(cè)試中，14B型號(hào)和Qwen2.5-Turbo在查找非常長(zhǎng)的文檔中的隱藏?cái)?shù)字時(shí)都達(dá)到了完美的準(zhǔn)確性。較小的7B型號(hào)也表現(xiàn)良好,，只有輕微的錯(cuò)誤,。在RULER、LV-Eval和LongbenchChat等要求更高的復(fù)雜的上下文測(cè)試中,，百萬(wàn)token模型的表現(xiàn)優(yōu)于128K token模型,，尤其是在超過(guò)64K token的序列中，14B型號(hào)甚至在RULER中得分超過(guò)90分——這是Qwen系列的第一次——在多個(gè)數(shù)據(jù)集上持續(xù)擊敗gpt - 4o mini,。

12 全文共 2 頁(yè)下一頁(yè)

關(guān)閉

阿里除夕夜拋出重磅新模型 Qwen2.5-Max性能驚艷

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)