DeepSeek和李飛飛之后，英偉達(dá)也看上阿里千問？千問潛力引關(guān)注(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-05-13 15:51:00 新浪財(cái)經(jīng)

此前，斯坦福大學(xué)人工智能研究院院長(zhǎng)李飛飛團(tuán)隊(duì)也曾基于阿里通義千問Qwen2.5-32B-Instruct,，訓(xùn)練出與OpenAI o1,、DeepSeek R1等尖端推理模型數(shù)學(xué)及編碼能力相當(dāng)?shù)膕1-32B模型,。今年4月，李飛飛團(tuán)隊(duì)的研究報(bào)告顯示：中美兩國(guó)模型性能差距由2023年的17.5%大幅縮小至0.3%,，近乎持平,。阿里的六大模型入選報(bào)告，貢獻(xiàn)度僅次于OpenAI和Google,，排名全球第三,、中國(guó)第一。

DeepSeek和李飛飛之后,，英偉達(dá)也看上阿里千問,？千問潛力引關(guān)注

更早之前，DeepSeek官方透露曾將DeepSeek-R1的推理能力蒸餾成六個(gè)模型開源給社區(qū),，其中有四個(gè)來(lái)自千問,，且在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo)OpenAI o1-mini的效果,。不少學(xué)者指出,，千問是所有開源模型中“隱藏驚喜”最大的?；F盧大學(xué)陳文虎教授直言,，用同樣的方法訓(xùn)練和微調(diào)別的模型都不管用，只有千問才有效果,，“千問系列模型一定有一些魔力,！”

事實(shí)上，在開源大模型領(lǐng)域,，被千問“迷之魅力”吸引來(lái)的不僅有頂級(jí)公司和大佬,，還有日常頻繁使用大模型的普通開發(fā)者們。據(jù)公開數(shù)據(jù)顯示,，截至當(dāng)前,，千問全球下載量超3億；在HuggingFace社區(qū)2024年全球模型下載量中占比超過(guò)30%,，穩(wěn)居全球第一,。千問衍生模型數(shù)量已突破10萬(wàn)，超越美國(guó)Llama模型,，成為全球第一AI開源模型,。在2025年2月的Huggingface全球開源大模型榜單中，排名前十的開源模型全部基于千問Qwen二次開發(fā),。

一個(gè)來(lái)自中國(guó)的大模型之所以在全球AI社區(qū)引發(fā)狂潮,，主要得益于以下三方面的作用,。首先，千問性能強(qiáng)勁且成本更低,。每次新發(fā)布幾乎都刷新了開源模型的上限,，例如最近的千問3在AIME25測(cè)評(píng)中斬獲81.5分，刷新開源紀(jì)錄,；在LiveCodeBench評(píng)測(cè)中突破70分大關(guān),，表現(xiàn)甚至超過(guò)Grok3。此外,，千問3的部署成本僅為性能相近模型的三分之一,，推理成本也不到DeepSeek-R1的三成。

首頁(yè)上一頁(yè)123 全文共 3 頁(yè)下一頁(yè)

關(guān)閉

DeepSeek和李飛飛之后，英偉達(dá)也看上阿里千問？ 千問潛力引關(guān)注(2)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek和李飛飛之后，英偉達(dá)也看上阿里千問？千問潛力引關(guān)注(2)