阿里通義千問開源負(fù)責(zé)人林俊旸在X上發(fā)文暗示,Qwen3模型有望于4月28日發(fā)布,。此前,,Qwen3系列模型合集曾在阿里巴巴旗下AI模型開源社區(qū)ModelScope短暫亮相后下線,包括Qwen3-4B-Base、Qwen3-1.7B,、Qwen3-0.6B及Qwen3-30B-A3B-Base四款模型,,均采用Apache License 2.0開源協(xié)議。盡管官方尚未正式公告,,但從命名規(guī)則與前代技術(shù)邏輯來看,,可以推測(cè)其技術(shù)路徑和定位方向。
此次發(fā)布的模型中,,Qwen3-4B,、Qwen3-1.7B和Qwen3-0.6B分別對(duì)應(yīng)40億、17億和6億參數(shù),,這類無后綴的命名方式可能表明它們?yōu)閱渭軜?gòu)稠密模型,,未采用混合專家(MoE)設(shè)計(jì),適合輕量化應(yīng)用場(chǎng)景,。而Qwen3-30B-A3B-Base則是MoE架構(gòu)的基礎(chǔ)模型,,總參數(shù)300億(30B),動(dòng)態(tài)調(diào)用30億(3B)參數(shù)處理任務(wù),。此外,,Qwen3支持高達(dá)256K的上下文長(zhǎng)度,涵蓋推理與非推理任務(wù),。
自2023年8月以來,,阿里云已相繼開源了Qwen、Qwen1.5,、Qwen2,、Qwen2.5等四代模型,涵蓋了從0.5B到110B的不同參數(shù)規(guī)模,,涉及大語言,、多模態(tài)、數(shù)學(xué)和代碼等多種模態(tài),。
3月6日凌晨,阿里云通義千問官微宣布發(fā)布并開源了最新的推理模型QwQ-32B,。這款模型擁有320億參數(shù),,性能可以與具備6710億參數(shù)的DeepSeek-R1相媲美
2025-03-06 09:53:18阿里推最新通義千問QwQ-32B推理模型