農(nóng)歷除夕夜,全球華人喜迎新春之時(shí),紐約證券交易所的電子屏上,阿里巴巴美股股價(jià)在收盤前從漲幅1%快速拉升至6.7%。這一行情異動(dòng)背后,,是一場(chǎng)技術(shù)上的奇襲。
1月29日凌晨,,阿里通義千問團(tuán)隊(duì)悄然上線了大模型Qwen2.5-Max,,在多個(gè)權(quán)威基準(zhǔn)測(cè)試中展現(xiàn)出與全球頂級(jí)模型比肩的性能。這是繼DeepSeek之后,,中國(guó)AI陣營(yíng)在高性能,、低成本技術(shù)路線上的又一重要突破。
市場(chǎng)人士分析稱,,此前過度聚焦DeepSeek,,卻忽視了包括阿里通義在內(nèi)的中國(guó)AI整體性追趕。行業(yè)媒體《信息平權(quán)》表示,,若阿里Qwen-2.5-max的性能超過V3,,可以對(duì)其RL推理模型給予更大期待。
當(dāng)阿里云展現(xiàn)出“強(qiáng)大模型+充足算力+完整云平臺(tái)”的組合優(yōu)勢(shì)時(shí),,是否印證了類似去年北美云計(jì)算服務(wù)商的投資邏輯,?如果美股因AI整體增值10萬億美元,中國(guó)AI資產(chǎn)的重估時(shí)機(jī)是否已至,?
Qwen2.5-Max采用超大規(guī)模MoE(混合專家)架構(gòu),,基于超過20萬億token的預(yù)訓(xùn)練數(shù)據(jù)。在MMLU-Pro,、LiveCodeBench,、LiveBench以及Arena-Hard等多個(gè)權(quán)威評(píng)測(cè)中,該模型均展現(xiàn)出與DeepSeek V3,、GPT-4和Claude-3.5-Sonnet比肩甚至領(lǐng)先的性能,。阿里團(tuán)隊(duì)表示,隨著后訓(xùn)練技術(shù)的進(jìn)步,,下一個(gè)版本將有望達(dá)到更高水平,。
Qwen2.5團(tuán)隊(duì)同步發(fā)布了兩個(gè)創(chuàng)新型號(hào):Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。這些開源模型支持高達(dá)100萬token的上下文窗口,,成為業(yè)內(nèi)首個(gè)達(dá)到此規(guī)模的公開可用模型,。這些模型使用稀疏注意力,處理百萬token輸入的速度比傳統(tǒng)方法快3到7倍,輸出長(zhǎng)度可達(dá)8000個(gè)token,。
11月14日,,光刻機(jī)巨頭阿斯麥股價(jià)在歐洲市場(chǎng)大幅上漲,,漲幅超過5.3%,達(dá)到661.10歐元/股,。美股盤前,,阿斯麥股價(jià)也上漲超過3%
2024-11-15 17:38:01光刻機(jī)巨頭拋出重磅信號(hào)短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外ChatGPT面市兩周年前夕,,有消息稱OpenAI計(jì)劃推出下一代前沿旗艦?zāi)P蚈rion
2024-10-26 00:11:04奧爾特曼辟謠OpenAI新模型消息根據(jù)中國(guó)結(jié)算的安排,對(duì)于10月1日(周二)至10月8日(周二)提交申請(qǐng)的新開證券賬戶,,于10月9日(周三)起可用于交易,。
2024-10-09 10:15:05今天