阿里云通義千問超大規(guī)模的MoE模型Qwen2.5-Max于1月29日凌晨正式上線,。該模型是阿里云通義團隊對MoE模型的最新成果,,預訓練數據超過20萬億tokens。在知識,、編程,、綜合能力以及人類偏好對齊等主流權威基準測試上,Qwen2.5-Max展現出與DeepSeek V3,、GPT-4和Claude-3.5-Sonnet比肩甚至領先的性能,。
Qwen2.5-Max的發(fā)布標志著中國AI陣營在高性能、低成本技術路線上的又一重要突破,。通義團隊對Qwen2.5-Max的指令模型版本和基座模型版本進行了評估測試,。指令模型在多項基準測試中幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B,。而在基座模型對比中,,Qwen2.5-Max與目前領先的開源MoE模型DeepSeek V3和最大的開源稠密模型Llama-3.1-405B相比,在大多數基準測試中都展現出了顯著優(yōu)勢,。
市場人士認為,,此前過度聚焦于DeepSeek,而忽視了包括阿里通義在內的中國AI整體性追趕,。行業(yè)媒體表示,,如果Qwen-2.5-max的確性能超過V3,可以對其RL推理模型給予更大期待,。農歷除夕夜,,阿里巴巴股價出現顯著異動,收盤前從漲幅1%快速拉升至6.71%,,總市值達到2284億美元,。
今年阿里云作為春晚云計算AI獨家合作伙伴,首次亮相中央廣播電視總臺蛇年春晚,,為春晚直播提供了全球云基礎設施和通義大模型AI技術支持,。春晚主舞臺采用了阿里云通義大模型AI技術來呈現科幻電影中的“子彈時間”經典畫面。通過云上多視角拍攝,觀眾能夠體驗到“空中環(huán)繞,、時空凝結”的創(chuàng)新觀看效果,。此外,阿里云通義AIGC技術成果也在節(jié)目畫面中得到應用,,為舞臺設計提供風格遷移,、參考圖生成、風格化處理等技術支持,。
短短一個月內,,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外農歷除夕夜,,全球華人喜迎新春之時,,紐約證券交易所的電子屏上,阿里巴巴美股股價在收盤前從漲幅1%快速拉升至6.7%,。這一行情異動背后,,是一場技術上的奇襲
2025-01-29 23:11:26阿里除夕夜拋出重磅新模型