中國工程院院士與DeepSeek過了一招 AI發(fā)展路徑新思考

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-03 09:44:52 上觀

近日，DeepSeek的出現(xiàn)引發(fā)了全球科技領(lǐng)域的廣泛關(guān)注和深入討論。中國科協(xié)會(huì)刊《科技導(dǎo)報(bào)》2025年第3期刊發(fā)了中國計(jì)算機(jī)學(xué)會(huì)原理事長李國杰院士的文章《DeepSeek引發(fā)的AI發(fā)展路徑思考》,，探討了DeepSeek背后所蘊(yùn)含的AI發(fā)展路徑問題。

李國杰是中國工程院院士,、發(fā)展中國家科學(xué)院（TWAS）院士,，研究方向涵蓋計(jì)算機(jī)體系結(jié)構(gòu)、并行算法,、人工智能等多個(gè)領(lǐng)域,。

DeepSeek的橫空出世是人工智能發(fā)展史上的標(biāo)志性事件。短短7天內(nèi),，用戶增長超過1億,，打破了用戶增長速度的世界紀(jì)錄,。與此同時(shí),，英偉達(dá)股價(jià)單日暴跌17%，市值縮水5890億美元,，創(chuàng)下美國上市公司單日最大損失紀(jì)錄,。這表明,，高算力和高投入不再是發(fā)展人工智能的唯一途徑,，集成電路制程優(yōu)勢也不再等于人工智能技術(shù)霸權(quán)。DeepSeek引領(lǐng)行業(yè)進(jìn)入以算法和模型架構(gòu)優(yōu)化為主的新時(shí)期，同時(shí)高度重視數(shù)據(jù)質(zhì)量和規(guī)模,，并理性提高算力。此外,，DeepSeek標(biāo)志著中國科技公司從“追趕者”變?yōu)椤耙?guī)則改寫者”,，在全球人工智能領(lǐng)域展現(xiàn)出顛覆性創(chuàng)新。

全球人工智能龍頭企業(yè)紛紛擁抱DeepSeek,，微軟最早宣布將其R1模型添加到Azure AI Foundry,，亞馬遜云科技（AWS）、英偉達(dá),、超威半導(dǎo)體（AMD）等也相繼部署DeepSeek V3和R1模型,。上億用戶和眾多大公司根據(jù)性價(jià)比和親身體驗(yàn)主動(dòng)融入DeepSeek生態(tài)。DeepSeek推出的高效率,、低成本推理模型和開源商業(yè)模式,，引領(lǐng)了人工智能行業(yè)新潮流。

V3和R1模型受歡迎的原因在于其在模型算法和系統(tǒng)軟件層次的重大創(chuàng)新,。V3模型參數(shù)量高達(dá)6710億,，但采用混合專家模型（MoE）架構(gòu)后，每次調(diào)用僅激活約370億個(gè)參數(shù),，顯著降低了訓(xùn)練計(jì)算成本,。改進(jìn)的多頭潛在注意力機(jī)制（MLA）減少了鍵值緩存開銷，將顯存占用降至其他大模型的5%~13%,，提升了運(yùn)行效率,。R1模型摒棄傳統(tǒng)監(jiān)督微調(diào)（SFT），提出群組相對策略優(yōu)化（GRPO）,，通過強(qiáng)化學(xué)習(xí)激發(fā)推理能力,，簡化了訓(xùn)練流程。這些發(fā)明雖非首次提出,，但DeepSeek通過努力將技術(shù)做到極致,，在前人成果基礎(chǔ)上登上新的技術(shù)高峰。

第3波人工智能興起后,，美國政府,、AI龍頭企業(yè)和投資界認(rèn)為高算力是發(fā)展人工智能的關(guān)鍵,。特朗普簽署法案啟動(dòng)星際之門計(jì)劃，投資5000億美元打造基礎(chǔ)設(shè)施,。然而,，DeepSeek的成功揭示了真相，即推理模型開發(fā)比想象中簡單,，各行各業(yè)都能參與,。初生牛犢不怕虎的中國科技工作者戳破了紙老虎，展示了其實(shí)力,。

2020年,，OpenAI發(fā)表論文提出規(guī)模法則，認(rèn)為增加模型規(guī)模,、數(shù)據(jù)量和計(jì)算資源可以顯著提升性能,。但規(guī)模法則并非科學(xué)定律，而是經(jīng)驗(yàn)歸納,。近幾年大模型訓(xùn)練效果表明,，要獲得線性增長需高指數(shù)性增加投入，這種模式難以持久,。理查德·薩頓指出,，雖然規(guī)模法則有效，但它不是解決所有問題的萬能鑰匙,，AI系統(tǒng)還需具備持續(xù)學(xué)習(xí),、適應(yīng)環(huán)境等能力。

DeepSeek的出現(xiàn)迫使AI界重新思考技術(shù)路線：是繼續(xù)追求高算力還是在算法優(yōu)化上下功夫,？DeepSeek標(biāo)志著從外延式發(fā)展階段轉(zhuǎn)向集約化系統(tǒng)優(yōu)化階段,。盡管成功并未否定算力的重要性，但綠色發(fā)展和降低能耗成為重要目標(biāo),。

通用人工智能是一個(gè)模糊概念,，OpenAI追求的是多個(gè)領(lǐng)域處理復(fù)雜問題的能力。莫拉維克悖論指出,，復(fù)雜問題易解而簡單問題難解,。因此，學(xué)術(shù)界更關(guān)注智能系統(tǒng)的持續(xù)學(xué)習(xí)和自我改進(jìn)能力,。實(shí)現(xiàn)通用智能是漸進(jìn)過程,，不會(huì)因某項(xiàng)技術(shù)突然到來。

DeepSeek和OpenAI都以通用人工智能為目標(biāo),，但路徑不同。OpenAI通過擴(kuò)大模型規(guī)模希望先做出通用基礎(chǔ)模型再蒸餾出垂直模型,。DeepSeek則走“由專到通”的道路,，通過模型算法和工程優(yōu)化探索受限資源下的通用智能,。未來可能是通專融合，形成智能時(shí)代產(chǎn)業(yè)新生態(tài),。

科技界公認(rèn)圖靈是人工智能奠基人,，他提出了計(jì)算模擬人類智能的假說。迄今為止,，人工智能成果離不開計(jì)算,，但高算力是否本質(zhì)需求值得深思。人腦高效低功耗是因?yàn)榉植际侥M計(jì)算,。深度學(xué)習(xí)奠基人辛頓提出“凡人計(jì)算”,，采用與人腦相同的存算一體模擬計(jì)算方式，追求高算效和高能效,，這是正確方向,。

斯坦福大學(xué)華裔科學(xué)家團(tuán)隊(duì)基于阿里通義千問模型，結(jié)合谷歌AI推理模型Gemini 2.0 Flash Thinking Experimental,，使用16個(gè)英偉達(dá)H100 GPU進(jìn)行了26分鐘訓(xùn)練,，以不到50美元費(fèi)用成功訓(xùn)練出s1模型，性能超越高端模型,。低成本模型顯示出巨大潛力,。

過去幾年，開源大模型性能始終落后于閉源大模型,，但DeepSeek改變了這一局面,，增強(qiáng)了開源社區(qū)信心。楊立昆認(rèn)為開源模型正在超越閉源模型,，改變發(fā)展模式比單項(xiàng)技術(shù)突破更重要,。DeepSeek徹底開源模式破解了企業(yè)數(shù)據(jù)安全難題，真正實(shí)現(xiàn)了技術(shù)民主化,。

長期以來,，美國AI龍頭公司夸大開源AI的安全風(fēng)險(xiǎn)，抑制開源AI發(fā)展,。事實(shí)上,，開源模型對全球AI供應(yīng)鏈至關(guān)重要，尤其是發(fā)展中國家,。若美國繼續(xù)設(shè)置障礙,，中國有望在開源AI全球供應(yīng)鏈中占據(jù)核心地位。真正的AI競爭不僅是技術(shù)和模型的競爭,，更是生態(tài)系統(tǒng),、商業(yè)模式和價(jià)值觀的競爭。開源戰(zhàn)略將證明誰擁抱開源，誰就能贏得未來,。

有人認(rèn)為ChatGPT是0到1的突破,，而DeepSeek只是1到N的擴(kuò)展，但這不符合人工智能發(fā)展歷史,。中國企業(yè)在應(yīng)用創(chuàng)新和商業(yè)模式創(chuàng)新方面表現(xiàn)出色,，但原創(chuàng)能力逐漸增強(qiáng)。DeepSeek可能標(biāo)志著中國AI產(chǎn)業(yè)從“技術(shù)跟跑”向“技術(shù)并跑和領(lǐng)跑”邁進(jìn),。

盡管中國在人工智能基礎(chǔ)研究和核心技術(shù)上仍與美國有差距,，但在論文發(fā)表總數(shù)和專利授權(quán)數(shù)量上超過美國。近年來中國進(jìn)步迅速,，根據(jù)統(tǒng)計(jì),，中國作者在過去四年增長了8倍。人工智能產(chǎn)業(yè)具有不對稱性,，一個(gè)小企業(yè)可以挑戰(zhàn)市值上萬億的龍頭企業(yè),。中國已有52家人工智能獨(dú)角獸企業(yè)，占全球18%,。這表明中國已有一批創(chuàng)新型小企業(yè)進(jìn)入世界前列,。

DeepSeek的成功說明算法優(yōu)化和系統(tǒng)級工程優(yōu)化不可或缺，優(yōu)秀工程師發(fā)揮著重要作用,。良好的工程教育體系和龐大的工程師隊(duì)伍是中國的優(yōu)勢,。年輕一代正成為科研主力，有信心在人工智能研究和應(yīng)用上走在前面,。

實(shí)現(xiàn)人工智能自立自強(qiáng)不僅靠國家規(guī)劃和資金支持,，更要做好人才使用培養(yǎng)和產(chǎn)業(yè)生態(tài)構(gòu)建。DeepSeek創(chuàng)始人梁文鋒強(qiáng)調(diào)自信,，選擇初出茅廬的年輕人,，拒絕經(jīng)驗(yàn)豐富的人才。這種用人理念為公司帶來創(chuàng)新動(dòng)力,，對傳統(tǒng)教育和聘用模式提出警示,。

構(gòu)建自主可控的產(chǎn)業(yè)生態(tài)是最困難的任務(wù)。英偉達(dá)的CUDA軟件生態(tài)是其護(hù)城河,，DeepSeek沖擊了這一生態(tài)但未完全繞過,。長遠(yuǎn)來看，需要開發(fā)一套自主可控的AI軟件工具系統(tǒng),，重構(gòu)AI軟件生態(tài),。這需要周密規(guī)劃和長期努力，相關(guān)部門應(yīng)組織全國力量完成這一任務(wù),。

資金投入雖非決定因素,，但中國投資市場規(guī)模急劇萎縮值得關(guān)注,。2023年美國AI投資達(dá)到672億美元，是中國的8.7倍,。風(fēng)險(xiǎn)投資和私募基金對科創(chuàng)產(chǎn)業(yè)極為重要,，中美科創(chuàng)市場曾并駕齊驅(qū)，但2023年中國投資額僅相當(dāng)于美國的8%,。政府和資本界需合力構(gòu)建健康的科創(chuàng)金融生態(tài)，為創(chuàng)新提供動(dòng)力,。

產(chǎn)業(yè)生態(tài)形成需市場牽引,，國家應(yīng)通過政策引導(dǎo)推廣AI應(yīng)用，增強(qiáng)國產(chǎn)硬件和軟件市場占有率,。重視芯片設(shè)計(jì)和大模型開源戰(zhàn)略,，爭取中國在全球人工智能開源系統(tǒng)中的主導(dǎo)作用。通過算法和軟件協(xié)同創(chuàng)新,，充分發(fā)揮硬件性能,，力爭中國人工智能科研和應(yīng)用走在世界前列。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

中國工程院院士與DeepSeek過了一招 AI發(fā)展路徑新思考

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)