DeepSeek會(huì)在全球AI競(jìng)爭(zhēng)中沉淪嗎 R1升級(jí)回應(yīng)質(zhì)疑,。5月28日,DeepSeek小助手在官方交流群中發(fā)布通知稱,,DeepSeek R1模型已完成小版本試升級(jí),歡迎用戶前往官方網(wǎng)頁(yè),、App和小程序測(cè)試。API接口和使用方式保持不變,。DeepSeek還在Huggingface上更新了DeepSeek-R1-0528版本,,但這并不是從2月就開(kāi)始宣傳的DeepSeek R2版本。
雖然不是DeepSeek R2,,但據(jù)眾多網(wǎng)友實(shí)際測(cè)評(píng),,新版DeepSeek R1在性能和體驗(yàn)上有明顯提升。Berkeley背景的代碼測(cè)試平臺(tái)Live CodeBench顯示,,DeepSeek-R1-0528當(dāng)前排名第四,,不過(guò)這個(gè)榜單沒(méi)有Claude 4。X(Twitter)博主OpenRouterAI也指出,,新版上下文長(zhǎng)度更長(zhǎng),,價(jià)格也更高。
此前5月13日,,全球最大的大模型整合應(yīng)用平臺(tái)Poe發(fā)布《2025年春季人工智能模型使用趨勢(shì)》報(bào)告,。報(bào)告顯示,DeepSeek R1的消息份額從2月中旬的高峰7%下降至4月底的3%,,下降超過(guò)50%,。Poe的報(bào)告表示,由于其他公司有競(jìng)爭(zhēng)力的推理模型相繼發(fā)布,,DeepSeek的影響力似乎已減弱,。
此次R1升級(jí)版本的發(fā)布,似乎意在回應(yīng)外界質(zhì)疑,,為逐漸冷卻的市場(chǎng)情緒重新“加溫”,。此前,多家媒體曾報(bào)道稱,,DeepSeek計(jì)劃在四月底至五月初發(fā)布新一代R2模型,,甚至一度傳出“提前上線”的消息。
5月14日,,梁文鋒及其團(tuán)隊(duì)發(fā)布了一篇14頁(yè)論文,,詳述在DeepSeek-V3的研發(fā)過(guò)程中,如何借助2048塊H800 GPU實(shí)現(xiàn)超大規(guī)模集群等效訓(xùn)練,。人們又開(kāi)始期待R2在架構(gòu)上的繼續(xù)升級(jí),,而此次R1的發(fā)布顯得比較有策略,既回應(yīng)了用戶期待,,又給自己留足了升級(jí)架構(gòu)的時(shí)間,。
DeepSeek創(chuàng)始人梁文鋒的故事廣為人知。他從小就展現(xiàn)出數(shù)學(xué)天賦,,在浙江大學(xué)本碩畢業(yè)后,,對(duì)金融產(chǎn)生了濃厚興趣,,與同學(xué)組隊(duì)探索機(jī)器學(xué)習(xí)在全自動(dòng)量化交易中的應(yīng)用,并成功賺取了人生第一桶金,。隨后,他創(chuàng)立了幻方量化,,迅速在國(guó)內(nèi)量化投資領(lǐng)域嶄露頭角,。
梁文鋒很早就注意到AI模型,2018年榮獲中國(guó)私募行業(yè)的最高獎(jiǎng)項(xiàng)——金牛獎(jiǎng),,并在頒獎(jiǎng)典禮上首次系統(tǒng)闡述AI在量化投資中的廣闊前景,。他在演講中提到:“量化投資的未來(lái),是用技術(shù)讓市場(chǎng)更有效率,?!?/p>
2019年,幻方量化前瞻性地大規(guī)模布局AI算力,,自主研發(fā)“螢火一號(hào)”訓(xùn)練平臺(tái),,投資近2億元,配備1100塊GPU,。2021年,,投資加碼到10億元的“螢火二號(hào)”投入使用,搭載約1萬(wàn)張英偉達(dá)A100顯卡,。憑借這些前期準(zhǔn)備,,恰逢2023年AI大模型迎來(lái)爆發(fā)之年,梁文鋒宣布正式進(jìn)軍通用人工智能領(lǐng)域,,創(chuàng)辦杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,,即DeepSeek。
DeepSeek采用差異化的技術(shù)路線,,開(kāi)發(fā)了新型MLA(多頭潛在注意力機(jī)制)和MoE架構(gòu),,大幅降低顯存占用和推理成本。2024年12月26日,,DeepSeek發(fā)布V3模型,,使用2048顆H800 GPU,訓(xùn)練成本僅557.6萬(wàn)美元,,性能卻超越多個(gè)開(kāi)源模型,,被硅谷稱為“來(lái)自東方的神秘力量”。
2025年1月20日,,DeepSeek發(fā)布R1模型,,部分性能可以追趕上當(dāng)時(shí)最先進(jìn)的大模型之一OpenAI o1模型,而且完全開(kāi)源,。7天內(nèi)用戶增長(zhǎng)至1億,,登頂中國(guó)和美國(guó)蘋果應(yīng)用商店免費(fèi)APP榜,,超越ChatGPT。R1的成功進(jìn)一步鞏固了DeepSeek的全球影響力,,引發(fā)美國(guó)科技股拋售,,如英偉達(dá)市值損失了6000億美元。
DeepSeek R1的發(fā)布被業(yè)內(nèi)譽(yù)為“AI的斯普特尼克時(shí)刻”,,美國(guó)總統(tǒng)特朗普也給予正面評(píng)價(jià),。NVIDIA CEO黃仁勛稱其為“送給全球AI行業(yè)的禮物”,Meta首席科學(xué)家楊立昆肯定其在開(kāi)源和技術(shù)優(yōu)化上的重大突破,。微軟,、OpenAI、亞馬遜等企業(yè)亦表達(dá)出對(duì)其技術(shù)實(shí)力的認(rèn)可,。
DeepSeek的崛起標(biāo)志著中國(guó)AI正從“技術(shù)追隨者”向“自主創(chuàng)新者”轉(zhuǎn)型,。然而,這種崛起引起了全球高度警惕,。微軟在DeepSeek發(fā)布初期曾在其Azure云服務(wù)上提供接入,,但隨后迅速轉(zhuǎn)變態(tài)度,封殺DeepSeek相關(guān)服務(wù),。OpenAI也公開(kāi)指控DeepSeek使用“蒸餾技術(shù)”,,涉嫌違反服務(wù)條款,并向美國(guó)政府提交信函,,建議實(shí)施AI出口管制,。
針對(duì)DeepSeek的新情況,美國(guó)多個(gè)政府部門開(kāi)始采取限制措施,。參議員喬什·霍利提出《美國(guó)人工智能能力與中國(guó)脫鉤法案》,,明確禁止美國(guó)個(gè)人或機(jī)構(gòu)下載、使用DeepSeek開(kāi)發(fā)的應(yīng)用程序,。其他國(guó)家和地區(qū)也出于國(guó)家安全,、數(shù)據(jù)隱私和技術(shù)主權(quán)的考量,禁止在政府機(jī)構(gòu),、公共部門或關(guān)鍵基礎(chǔ)設(shè)施設(shè)備上安裝或運(yùn)行DeepSeek的相關(guān)應(yīng)用與模型,。
對(duì)此,中國(guó)外交部發(fā)言人郭嘉昆回應(yīng)道,,中國(guó)政府高度重視并依法保護(hù)數(shù)據(jù)隱私和安全,。DeepSeek通過(guò)主動(dòng)公開(kāi)其模型代碼、技術(shù)論文及訓(xùn)練細(xì)節(jié),,以及學(xué)術(shù)界背書,,試圖緩解國(guó)際社會(huì)的質(zhì)疑和壓力。然而,,這些應(yīng)對(duì)策略尚不能阻止上述國(guó)家的政府設(shè)備禁令,、歐盟的監(jiān)管調(diào)查以及安全漏洞爭(zhēng)議,。
在5月28日重新回到公眾視線之前,DeepSeek經(jīng)歷了長(zhǎng)達(dá)三個(gè)月的沉寂期,。盡管外界對(duì)梁文鋒的動(dòng)向和團(tuán)隊(duì)的進(jìn)展一無(wú)所知,,但競(jìng)爭(zhēng)對(duì)手的行動(dòng)并未停滯。OpenAI很快發(fā)布了o3系列模型,,顯著提升了數(shù)學(xué),、科學(xué)和復(fù)雜推理任務(wù)中的表現(xiàn)。Anthropic則于2月推出Claude 3.7 Sonnet,,并在5月23日推出了Claude Opus 4和Claude Sonnet 4。Google也在2025年5月的Google I/O大會(huì)上發(fā)布了Gemini 2.5 Pro和Flash版本,,表現(xiàn)出色,。
DeepSeek R1目前已下滑至權(quán)威大模型評(píng)測(cè)平臺(tái)Chatbot Arena LLM Leaderboard的第9位。根據(jù)手機(jī)下載排名權(quán)威網(wǎng)站Sensor Tower旗下的Data.ai顯示,,DeepSeek在全球下載排名中穩(wěn)定在第11位,,但在用戶活躍度、使用時(shí)長(zhǎng)等排名中,,前100名均看不到DeepSeek的身影,。
DeepSeek市場(chǎng)份額的下滑并非偶然。綜合業(yè)內(nèi)分析與實(shí)測(cè)反饋,,原因大致可歸結(jié)為:新旗艦?zāi)P涂焖傩Q食舊模型,;DeepSeek R1的推理速度慢;與大廠生態(tài)基本沒(méi)有綁定,。然而,,R1 0528版本的發(fā)布展示了DeepSeek在深度思考能力和復(fù)雜推理任務(wù)方面的顯著提升。DeepSeek通過(guò)MIT協(xié)議開(kāi)源R1并構(gòu)建開(kāi)放生態(tài)來(lái)重塑其國(guó)際形象,,雖然尚未形成類似Meta Llama那樣的“飛輪效應(yīng)”,,但如果DeepSeek在性能和工具鏈方面進(jìn)一步實(shí)現(xiàn)突破,并提供更加友好的部署與微調(diào)能力,,或許有機(jī)會(huì)繞開(kāi)主流市場(chǎng)封鎖,,從全球開(kāi)發(fā)者群體走出一條非典型的國(guó)際增長(zhǎng)曲線。
未來(lái)的征程將是一場(chǎng)圍繞信任與生態(tài)的系統(tǒng)性博弈,。DeepSeek的技術(shù)突破固然打開(kāi)了通往全球的大門,,但能否穿越復(fù)雜的國(guó)際環(huán)境、以透明實(shí)踐贏得信任,,并構(gòu)建真正開(kāi)放協(xié)作的全球AI生態(tài),,才是其能否引領(lǐng)下一波人工智能浪潮的關(guān)鍵所在。
中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)在短短一個(gè)月內(nèi)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 19:35:39DeepSeek為何引發(fā)全球轟動(dòng)