此前,斯坦福大學(xué)人工智能研究院院長(zhǎng)李飛飛團(tuán)隊(duì)也曾基于阿里通義千問Qwen2.5-32B-Instruct,,訓(xùn)練出與OpenAI o1,、DeepSeek R1等尖端推理模型數(shù)學(xué)及編碼能力相當(dāng)?shù)膕1-32B模型,。今年4月,李飛飛團(tuán)隊(duì)的研究報(bào)告顯示:中美兩國(guó)模型性能差距由2023年的17.5%大幅縮小至0.3%,,近乎持平,。阿里的六大模型入選報(bào)告,貢獻(xiàn)度僅次于OpenAI和Google,,排名全球第三,、中國(guó)第一。
更早之前,DeepSeek官方透露曾將DeepSeek-R1的推理能力蒸餾成六個(gè)模型開源給社區(qū),,其中有四個(gè)來(lái)自千問,,且在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo)OpenAI o1-mini的效果,。不少學(xué)者指出,,千問是所有開源模型中“隱藏驚喜”最大的?;F盧大學(xué)陳文虎教授直言,,用同樣的方法訓(xùn)練和微調(diào)別的模型都不管用,只有千問才有效果,,“千問系列模型一定有一些魔力,!”
事實(shí)上,在開源大模型領(lǐng)域,,被千問“迷之魅力”吸引來(lái)的不僅有頂級(jí)公司和大佬,,還有日常頻繁使用大模型的普通開發(fā)者們。據(jù)公開數(shù)據(jù)顯示,,截至當(dāng)前,,千問全球下載量超3億;在HuggingFace社區(qū)2024年全球模型下載量中占比超過(guò)30%,,穩(wěn)居全球第一,。千問衍生模型數(shù)量已突破10萬(wàn),超越美國(guó)Llama模型,,成為全球第一AI開源模型,。在2025年2月的Huggingface全球開源大模型榜單中,排名前十的開源模型全部基于千問Qwen二次開發(fā),。
一個(gè)來(lái)自中國(guó)的大模型之所以在全球AI社區(qū)引發(fā)狂潮,,主要得益于以下三方面的作用,。首先,千問性能強(qiáng)勁且成本更低,。每次新發(fā)布幾乎都刷新了開源模型的上限,,例如最近的千問3在AIME25測(cè)評(píng)中斬獲81.5分,刷新開源紀(jì)錄,;在LiveCodeBench評(píng)測(cè)中突破70分大關(guān),,表現(xiàn)甚至超過(guò)Grok3。此外,,千問3的部署成本僅為性能相近模型的三分之一,,推理成本也不到DeepSeek-R1的三成。