阿里通義千問開源負(fù)責(zé)人林俊旸在X上發(fā)文暗示,,Qwen3模型有望于4月28日發(fā)布,。此前,,Qwen3系列模型合集曾在阿里巴巴旗下AI模型開源社區(qū)ModelScope短暫亮相后下線,包括Qwen3-4B-Base,、Qwen3-1.7B,、Qwen3-0.6B及Qwen3-30B-A3B-Base四款模型,均采用Apache License 2.0開源協(xié)議,。盡管官方尚未正式公告,,但從命名規(guī)則與前代技術(shù)邏輯來看,可以推測其技術(shù)路徑和定位方向,。
此次發(fā)布的模型中,,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B分別對應(yīng)40億、17億和6億參數(shù),,這類無后綴的命名方式可能表明它們?yōu)閱渭軜?gòu)稠密模型,,未采用混合專家(MoE)設(shè)計,適合輕量化應(yīng)用場景,。而Qwen3-30B-A3B-Base則是MoE架構(gòu)的基礎(chǔ)模型,總參數(shù)300億(30B),,動態(tài)調(diào)用30億(3B)參數(shù)處理任務(wù),。此外,Qwen3支持高達(dá)256K的上下文長度,,涵蓋推理與非推理任務(wù),。
自2023年8月以來,阿里云已相繼開源了Qwen,、Qwen1.5,、Qwen2、Qwen2.5等四代模型,,涵蓋了從0.5B到110B的不同參數(shù)規(guī)模,,涉及大語言、多模態(tài),、數(shù)學(xué)和代碼等多種模態(tài),。
3月6日凌晨,阿里云通義千問官微宣布發(fā)布并開源了最新的推理模型QwQ-32B,。這款模型擁有320億參數(shù),,性能可以與具備6710億參數(shù)的DeepSeek-R1相媲美
2025-03-06 09:53:18阿里推最新通義千問QwQ-32B推理模型在全球開源大模型生態(tài)圈中,阿里無疑是備受矚目的存在,。上周,,繼DeepSeek和“AI教母”李飛飛之后,英偉達(dá)也選擇了與阿里合作
2025-05-13 15:51:00DeepSeek和李飛飛之后