阿里新模型聲稱超越DeepSeek 展現(xiàn)領(lǐng)先性能

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-30 13:16:20 讀創(chuàng)新聞

阿里云通義千問超大規(guī)模的MoE模型Qwen2.5-Max于1月29日凌晨正式上線。該模型是阿里云通義團(tuán)隊(duì)對(duì)MoE模型的最新成果,，預(yù)訓(xùn)練數(shù)據(jù)超過20萬億tokens,。在知識(shí),、編程、綜合能力以及人類偏好對(duì)齊等主流權(quán)威基準(zhǔn)測(cè)試上,，Qwen2.5-Max展現(xiàn)出與DeepSeek V3,、GPT-4和Claude-3.5-Sonnet比肩甚至領(lǐng)先的性能。

阿里新模型聲稱超越DeepSeek

Qwen2.5-Max的發(fā)布標(biāo)志著中國(guó)AI陣營(yíng)在高性能,、低成本技術(shù)路線上的又一重要突破,。通義團(tuán)隊(duì)對(duì)Qwen2.5-Max的指令模型版本和基座模型版本進(jìn)行了評(píng)估測(cè)試。指令模型在多項(xiàng)基準(zhǔn)測(cè)試中幾乎全面超越了GPT-4o,、DeepSeek-V3及Llama-3.1-405B,。而在基座模型對(duì)比中，Qwen2.5-Max與目前領(lǐng)先的開源MoE模型DeepSeek V3和最大的開源稠密模型Llama-3.1-405B相比,，在大多數(shù)基準(zhǔn)測(cè)試中都展現(xiàn)出了顯著優(yōu)勢(shì),。

阿里新模型聲稱超越DeepSeek 展現(xiàn)領(lǐng)先性能

市場(chǎng)人士認(rèn)為，此前過度聚焦于DeepSeek,，而忽視了包括阿里通義在內(nèi)的中國(guó)AI整體性追趕,。行業(yè)媒體表示，如果Qwen-2.5-max的確性能超過V3,，可以對(duì)其RL推理模型給予更大期待,。農(nóng)歷除夕夜，阿里巴巴股價(jià)出現(xiàn)顯著異動(dòng),，收盤前從漲幅1%快速拉升至6.71%,，總市值達(dá)到2284億美元。

阿里新模型聲稱超越DeepSeek 展現(xiàn)領(lǐng)先性能

今年阿里云作為春晚云計(jì)算AI獨(dú)家合作伙伴,，首次亮相中央廣播電視總臺(tái)蛇年春晚，為春晚直播提供了全球云基礎(chǔ)設(shè)施和通義大模型AI技術(shù)支持,。春晚主舞臺(tái)采用了阿里云通義大模型AI技術(shù)來呈現(xiàn)科幻電影中的“子彈時(shí)間”經(jīng)典畫面,。通過云上多視角拍攝，觀眾能夠體驗(yàn)到“空中環(huán)繞,、時(shí)空凝結(jié)”的創(chuàng)新觀看效果,。此外,，阿里云通義AIGC技術(shù)成果也在節(jié)目畫面中得到應(yīng)用，為舞臺(tái)設(shè)計(jì)提供風(fēng)格遷移,、參考圖生成,、風(fēng)格化處理等技術(shù)支持。

阿里新模型聲稱超越DeepSeek 展現(xiàn)領(lǐng)先性能

(責(zé)任編輯：張蕾)

關(guān)閉

阿里新模型聲稱超越DeepSeek 展現(xiàn)領(lǐng)先性能

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)