阿里云通義千問超大規(guī)模的MoE模型Qwen2.5-Max于1月29日凌晨正式上線。該模型是阿里云通義團(tuán)隊(duì)對(duì)MoE模型的最新成果,,預(yù)訓(xùn)練數(shù)據(jù)超過20萬億tokens,。在知識(shí),、編程、綜合能力以及人類偏好對(duì)齊等主流權(quán)威基準(zhǔn)測(cè)試上,,Qwen2.5-Max展現(xiàn)出與DeepSeek V3,、GPT-4和Claude-3.5-Sonnet比肩甚至領(lǐng)先的性能。
Qwen2.5-Max的發(fā)布標(biāo)志著中國(guó)AI陣營(yíng)在高性能,、低成本技術(shù)路線上的又一重要突破,。通義團(tuán)隊(duì)對(duì)Qwen2.5-Max的指令模型版本和基座模型版本進(jìn)行了評(píng)估測(cè)試。指令模型在多項(xiàng)基準(zhǔn)測(cè)試中幾乎全面超越了GPT-4o,、DeepSeek-V3及Llama-3.1-405B,。而在基座模型對(duì)比中,Qwen2.5-Max與目前領(lǐng)先的開源MoE模型DeepSeek V3和最大的開源稠密模型Llama-3.1-405B相比,,在大多數(shù)基準(zhǔn)測(cè)試中都展現(xiàn)出了顯著優(yōu)勢(shì),。
市場(chǎng)人士認(rèn)為,此前過度聚焦于DeepSeek,,而忽視了包括阿里通義在內(nèi)的中國(guó)AI整體性追趕,。行業(yè)媒體表示,如果Qwen-2.5-max的確性能超過V3,,可以對(duì)其RL推理模型給予更大期待,。農(nóng)歷除夕夜,阿里巴巴股價(jià)出現(xiàn)顯著異動(dòng),,收盤前從漲幅1%快速拉升至6.71%,,總市值達(dá)到2284億美元。
今年阿里云作為春晚云計(jì)算AI獨(dú)家合作伙伴,,首次亮相中央廣播電視總臺(tái)蛇年春晚,為春晚直播提供了全球云基礎(chǔ)設(shè)施和通義大模型AI技術(shù)支持,。春晚主舞臺(tái)采用了阿里云通義大模型AI技術(shù)來呈現(xiàn)科幻電影中的“子彈時(shí)間”經(jīng)典畫面,。通過云上多視角拍攝,觀眾能夠體驗(yàn)到“空中環(huán)繞,、時(shí)空凝結(jié)”的創(chuàng)新觀看效果,。此外,,阿里云通義AIGC技術(shù)成果也在節(jié)目畫面中得到應(yīng)用,為舞臺(tái)設(shè)計(jì)提供風(fēng)格遷移,、參考圖生成,、風(fēng)格化處理等技術(shù)支持。
短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外