DeepSeek和李飛飛之后,,英偉達也看上阿里千問,? 千問潛力引關(guān)注!在全球開源大模型生態(tài)圈中,,阿里無疑是備受矚目的存在,。上周,繼DeepSeek和“AI教母”李飛飛之后,,英偉達也選擇了與阿里合作,。在最新的“混合推理模型”千問3宣布開源當日,英偉達迅速接入適配,,并于5月9日開源了全新的代碼推理模型Open Code Reasoning(簡稱OCR),,包括7B、14B,、32B三種尺寸,,基礎(chǔ)模型均基于通義千問。
在LiveCodeBench評測中,英偉達的OCR-Qwen-32B-Instruct模型成功超越了Open AI公司的o3-mini和o1模型,,該模型正是基于Qwen2.5-32B微調(diào)形成的,。盡管通義千問已迭代至3.0版本,性能再度突破,,但英偉達仍基于上一代千問模型做出了比肩全球一流水平的模型,,這讓人不禁好奇千問究竟還有多少隱藏潛力待發(fā)掘。
目前,英偉達開源的OCR系列模型的代碼及數(shù)據(jù)集已在Hugging Face平臺上公開分享,,供開發(fā)者們免費瀏覽學習,。其中,OCR-Qwen-32B-Instruct在LiveCodeBench的pass1測試中獲得了61.8%的成績,,超過了OpenAI的O3-Mini-2025-01-31(Low)和O1-2024-12-17(Low),。長期以來,人們普遍認為閉源模型在能力上遠超開源模型,,但英偉達此次開源的OCR模型反駁了這一觀點,。只要底座模型足夠好,,即使不是最新版本的開源模型,在經(jīng)過高質(zhì)量訓練和優(yōu)化后,,也能超越閉源模型,。
此前,,斯坦福大學人工智能研究院院長李飛飛團隊也曾基于阿里通義千問Qwen2.5-32B-Instruct,訓練出與OpenAI o1,、DeepSeek R1等尖端推理模型數(shù)學及編碼能力相當?shù)膕1-32B模型,。今年4月,李飛飛團隊的研究報告顯示:中美兩國模型性能差距由2023年的17.5%大幅縮小至0.3%,,近乎持平,。阿里的六大模型入選報告,貢獻度僅次于OpenAI和Google,,排名全球第三,、中國第一。
更早之前,DeepSeek官方透露曾將DeepSeek-R1的推理能力蒸餾成六個模型開源給社區(qū),,其中有四個來自千問,,且在多項能力上實現(xiàn)了對標OpenAI o1-mini的效果。不少學者指出,,千問是所有開源模型中“隱藏驚喜”最大的,。滑鐵盧大學陳文虎教授直言,,用同樣的方法訓練和微調(diào)別的模型都不管用,,只有千問才有效果,“千問系列模型一定有一些魔力,!”
事實上,,在開源大模型領(lǐng)域,被千問“迷之魅力”吸引來的不僅有頂級公司和大佬,,還有日常頻繁使用大模型的普通開發(fā)者們,。據(jù)公開數(shù)據(jù)顯示,截至當前,,千問全球下載量超3億;在HuggingFace社區(qū)2024年全球模型下載量中占比超過30%,,穩(wěn)居全球第一,。千問衍生模型數(shù)量已突破10萬,,超越美國Llama模型,成為全球第一AI開源模型,。在2025年2月的Huggingface全球開源大模型榜單中,,排名前十的開源模型全部基于千問Qwen二次開發(fā)。
一個來自中國的大模型之所以在全球AI社區(qū)引發(fā)狂潮,,主要得益于以下三方面的作用,。首先,千問性能強勁且成本更低,。每次新發(fā)布幾乎都刷新了開源模型的上限,,例如最近的千問3在AIME25測評中斬獲81.5分,刷新開源紀錄,;在LiveCodeBench評測中突破70分大關(guān),,表現(xiàn)甚至超過Grok3。此外,,千問3的部署成本僅為性能相近模型的三分之一,,推理成本也不到DeepSeek-R1的三成。
其次,,千問提供了豐富的開源選項,。阿里通義團隊截至目前共開源了200多款模型,從文本生成模型,、視覺理解/生成模型,、語音理解/生成模型到文生圖及視頻模型等“全模態(tài)”模型,再到0.5B,、1.5B,、3B、7B,、14B,、32B、72B,、110B,、235B等“全尺寸”模型,幾乎是世界上開源層次最豐富,、布局最飽滿的模型家族,。千問3提供的119種語言支持,對全球開發(fā)者特別是小語種地區(qū)的開發(fā)者來說是一次極大的利好,。
最后,,千問擁有廣泛的“朋友圈”,圍繞千問打造了強大的開源生態(tài),。國際開源社區(qū)對Qwen3的支持非常豐富,,覆蓋了主流的開源機構(gòu)和平臺,。這意味著,千問3一開源,,所有開發(fā)者和機構(gòu)就可直接上手體驗,,無需等待配套工具。在產(chǎn)業(yè)界,,一大批產(chǎn)業(yè)鏈上下游企業(yè)也宣布適配及接入千問3,,包括英特爾、高通,、聯(lián)發(fā)科等多家頭部芯片廠商,,以及華為昇騰、百度千帆,、中科曙光等多家AI公司和大模型服務(wù)平臺,。
千問不僅是全球開源社區(qū)的領(lǐng)頭羊,也是阿里最重要的AI戰(zhàn)略支點,。阿里巴巴集團CEO吳泳銘宣布,,未來三年將投入超過3800億元用于建設(shè)云和人工智能硬件基礎(chǔ)設(shè)施,這是中國民營企業(yè)在云和AI硬件基礎(chǔ)設(shè)施建設(shè)領(lǐng)域的最大規(guī)模投資,。阿里巴巴董事長蔡崇信也強調(diào),,阿里要把AI融入每一塊業(yè)務(wù)、每一個環(huán)節(jié),,未來三到五年,,所有業(yè)務(wù)都應(yīng)以AI為驅(qū)動。
全新開源的千問3在Agent能力樹方面達到了頂級水平,,在評估模型Agent能力的BFCL評測中創(chuàng)下70.8的新高,,超越Gemini2.5-Pro、OpenAI-o1等頂尖模型,。同時,,千問3原生支持MCP協(xié)議,并具備強大的工具調(diào)用能力,,結(jié)合封裝了工具調(diào)用模板和解析器的Qwen-Agent框架,,將大大降低編碼復雜性,,實現(xiàn)高效的手機及電腦Agent操作等任務(wù),。
阿里云百煉上線業(yè)界首個全生命周期MCP服務(wù),,滿足不同場景的Agent應(yīng)用開發(fā)需求。阿里云牽頭的中國第一AI開源社區(qū)魔搭推出了全新的MCP廣場,,通過開源開放的方式加速Agent及AI應(yīng)用的創(chuàng)新和落地,。阿里云還預(yù)告了AI Agent Store的愿景,通過這種創(chuàng)新模式,,把阿里巴巴集團和生態(tài)伙伴的Agent向外開放,,讓各行各業(yè)的人都可以擁有自己專屬的助理,。
隨著通義系列大模型的發(fā)展,阿里正撬動起一個更為廣泛的AI落地新未來,。
2025年伊始,,中國迎來了自己的ChatGPT時刻。DeepSeek-R1模型以其卓越的能力引起了全球關(guān)注,,從硅谷到中國,、從老人到小孩,,各行各業(yè)的人都在使用DeepSeek
2025-02-18 09:48:48人均DeepSeek之后AI應(yīng)用還能怎么做