阿里云通義千問超大規(guī)模的MoE模型Qwen2.5-Max于1月29日凌晨正式上線,。該模型是阿里云通義團(tuán)隊對MoE模型的最新成果,預(yù)訓(xùn)練數(shù)據(jù)超過20萬億tokens,。在知識,、編程、綜合能力以及人類偏好對齊等主流權(quán)威基準(zhǔn)測試上,,Qwen2.5-Max展現(xiàn)出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩甚至領(lǐng)先的性能,。
Qwen2.5-Max的發(fā)布標(biāo)志著中國AI陣營在高性能,、低成本技術(shù)路線上的又一重要突破。通義團(tuán)隊對Qwen2.5-Max的指令模型版本和基座模型版本進(jìn)行了評估測試,。指令模型在多項基準(zhǔn)測試中幾乎全面超越了GPT-4o,、DeepSeek-V3及Llama-3.1-405B。而在基座模型對比中,Qwen2.5-Max與目前領(lǐng)先的開源MoE模型DeepSeek V3和最大的開源稠密模型Llama-3.1-405B相比,,在大多數(shù)基準(zhǔn)測試中都展現(xiàn)出了顯著優(yōu)勢,。
市場人士認(rèn)為,此前過度聚焦于DeepSeek,,而忽視了包括阿里通義在內(nèi)的中國AI整體性追趕,。行業(yè)媒體表示,如果Qwen-2.5-max的確性能超過V3,,可以對其RL推理模型給予更大期待,。農(nóng)歷除夕夜,阿里巴巴股價出現(xiàn)顯著異動,,收盤前從漲幅1%快速拉升至6.71%,,總市值達(dá)到2284億美元。
今年阿里云作為春晚云計算AI獨(dú)家合作伙伴,,首次亮相中央廣播電視總臺蛇年春晚,,為春晚直播提供了全球云基礎(chǔ)設(shè)施和通義大模型AI技術(shù)支持。春晚主舞臺采用了阿里云通義大模型AI技術(shù)來呈現(xiàn)科幻電影中的“子彈時間”經(jīng)典畫面,。通過云上多視角拍攝,,觀眾能夠體驗(yàn)到“空中環(huán)繞、時空凝結(jié)”的創(chuàng)新觀看效果,。此外,,阿里云通義AIGC技術(shù)成果也在節(jié)目畫面中得到應(yīng)用,為舞臺設(shè)計提供風(fēng)格遷移,、參考圖生成,、風(fēng)格化處理等技術(shù)支持。
短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外農(nóng)歷除夕夜,,全球華人喜迎新春之時,,紐約證券交易所的電子屏上,阿里巴巴美股股價在收盤前從漲幅1%快速拉升至6.7%,。這一行情異動背后,,是一場技術(shù)上的奇襲
2025-01-29 23:11:26阿里除夕夜拋出重磅新模型