近日,,DeepSeek的出現(xiàn)引發(fā)了全球科技領(lǐng)域的廣泛關(guān)注和深入討論,。中國科協(xié)會(huì)刊《科技導(dǎo)報(bào)》2025年第3期刊發(fā)了中國計(jì)算機(jī)學(xué)會(huì)原理事長李國杰院士的文章《DeepSeek引發(fā)的AI發(fā)展路徑思考》,探討了DeepSeek背后所蘊(yùn)含的AI發(fā)展路徑問題,。
李國杰是中國工程院院士,、發(fā)展中國家科學(xué)院(TWAS)院士,研究方向涵蓋計(jì)算機(jī)體系結(jié)構(gòu),、并行算法,、人工智能等多個(gè)領(lǐng)域。
DeepSeek的橫空出世是人工智能發(fā)展史上的標(biāo)志性事件,。短短7天內(nèi),,用戶增長超過1億,打破了用戶增長速度的世界紀(jì)錄,。與此同時(shí),,英偉達(dá)股價(jià)單日暴跌17%,市值縮水5890億美元,,創(chuàng)下美國上市公司單日最大損失紀(jì)錄,。這表明,高算力和高投入不再是發(fā)展人工智能的唯一途徑,,集成電路制程優(yōu)勢(shì)也不再等于人工智能技術(shù)霸權(quán),。DeepSeek引領(lǐng)行業(yè)進(jìn)入以算法和模型架構(gòu)優(yōu)化為主的新時(shí)期,同時(shí)高度重視數(shù)據(jù)質(zhì)量和規(guī)模,,并理性提高算力,。此外,,DeepSeek標(biāo)志著中國科技公司從“追趕者”變?yōu)椤耙?guī)則改寫者”,在全球人工智能領(lǐng)域展現(xiàn)出顛覆性創(chuàng)新,。
全球人工智能龍頭企業(yè)紛紛擁抱DeepSeek,,微軟最早宣布將其R1模型添加到Azure AI Foundry,亞馬遜云科技(AWS),、英偉達(dá),、超威半導(dǎo)體(AMD)等也相繼部署DeepSeek V3和R1模型。上億用戶和眾多大公司根據(jù)性價(jià)比和親身體驗(yàn)主動(dòng)融入DeepSeek生態(tài),。DeepSeek推出的高效率,、低成本推理模型和開源商業(yè)模式,引領(lǐng)了人工智能行業(yè)新潮流,。
V3和R1模型受歡迎的原因在于其在模型算法和系統(tǒng)軟件層次的重大創(chuàng)新,。V3模型參數(shù)量高達(dá)6710億,但采用混合專家模型(MoE)架構(gòu)后,,每次調(diào)用僅激活約370億個(gè)參數(shù),,顯著降低了訓(xùn)練計(jì)算成本。改進(jìn)的多頭潛在注意力機(jī)制(MLA)減少了鍵值緩存開銷,,將顯存占用降至其他大模型的5%~13%,,提升了運(yùn)行效率。R1模型摒棄傳統(tǒng)監(jiān)督微調(diào)(SFT),,提出群組相對(duì)策略優(yōu)化(GRPO),,通過強(qiáng)化學(xué)習(xí)激發(fā)推理能力,簡(jiǎn)化了訓(xùn)練流程,。這些發(fā)明雖非首次提出,,但DeepSeek通過努力將技術(shù)做到極致,,在前人成果基礎(chǔ)上登上新的技術(shù)高峰,。
第3波人工智能興起后,美國政府,、AI龍頭企業(yè)和投資界認(rèn)為高算力是發(fā)展人工智能的關(guān)鍵,。特朗普簽署法案啟動(dòng)星際之門計(jì)劃,投資5000億美元打造基礎(chǔ)設(shè)施,。然而,,DeepSeek的成功揭示了真相,即推理模型開發(fā)比想象中簡(jiǎn)單,,各行各業(yè)都能參與,。初生牛犢不怕虎的中國科技工作者戳破了紙老虎,展示了其實(shí)力,。
2020年,,OpenAI發(fā)表論文提出規(guī)模法則,,認(rèn)為增加模型規(guī)模、數(shù)據(jù)量和計(jì)算資源可以顯著提升性能,。但規(guī)模法則并非科學(xué)定律,,而是經(jīng)驗(yàn)歸納。近幾年大模型訓(xùn)練效果表明,,要獲得線性增長需高指數(shù)性增加投入,,這種模式難以持久。理查德·薩頓指出,,雖然規(guī)模法則有效,,但它不是解決所有問題的萬能鑰匙,AI系統(tǒng)還需具備持續(xù)學(xué)習(xí),、適應(yīng)環(huán)境等能力,。
DeepSeek的出現(xiàn)迫使AI界重新思考技術(shù)路線:是繼續(xù)追求高算力還是在算法優(yōu)化上下功夫?DeepSeek標(biāo)志著從外延式發(fā)展階段轉(zhuǎn)向集約化系統(tǒng)優(yōu)化階段,。盡管成功并未否定算力的重要性,,但綠色發(fā)展和降低能耗成為重要目標(biāo)。
通用人工智能是一個(gè)模糊概念,,OpenAI追求的是多個(gè)領(lǐng)域處理復(fù)雜問題的能力,。莫拉維克悖論指出,復(fù)雜問題易解而簡(jiǎn)單問題難解,。因此,,學(xué)術(shù)界更關(guān)注智能系統(tǒng)的持續(xù)學(xué)習(xí)和自我改進(jìn)能力。實(shí)現(xiàn)通用智能是漸進(jìn)過程,,不會(huì)因某項(xiàng)技術(shù)突然到來,。
DeepSeek和OpenAI都以通用人工智能為目標(biāo),但路徑不同,。OpenAI通過擴(kuò)大模型規(guī)模希望先做出通用基礎(chǔ)模型再蒸餾出垂直模型,。DeepSeek則走“由專到通”的道路,通過模型算法和工程優(yōu)化探索受限資源下的通用智能,。未來可能是通專融合,,形成智能時(shí)代產(chǎn)業(yè)新生態(tài)。
科技界公認(rèn)圖靈是人工智能奠基人,,他提出了計(jì)算模擬人類智能的假說,。迄今為止,人工智能成果離不開計(jì)算,,但高算力是否本質(zhì)需求值得深思,。人腦高效低功耗是因?yàn)榉植际侥M計(jì)算。深度學(xué)習(xí)奠基人辛頓提出“凡人計(jì)算”,采用與人腦相同的存算一體模擬計(jì)算方式,,追求高算效和高能效,,這是正確方向。
斯坦福大學(xué)華裔科學(xué)家團(tuán)隊(duì)基于阿里通義千問模型,,結(jié)合谷歌AI推理模型Gemini 2.0 Flash Thinking Experimental,,使用16個(gè)英偉達(dá)H100 GPU進(jìn)行了26分鐘訓(xùn)練,以不到50美元費(fèi)用成功訓(xùn)練出s1模型,,性能超越高端模型,。低成本模型顯示出巨大潛力。
過去幾年,,開源大模型性能始終落后于閉源大模型,,但DeepSeek改變了這一局面,增強(qiáng)了開源社區(qū)信心,。楊立昆認(rèn)為開源模型正在超越閉源模型,,改變發(fā)展模式比單項(xiàng)技術(shù)突破更重要。DeepSeek徹底開源模式破解了企業(yè)數(shù)據(jù)安全難題,,真正實(shí)現(xiàn)了技術(shù)民主化,。
長期以來,美國AI龍頭公司夸大開源AI的安全風(fēng)險(xiǎn),,抑制開源AI發(fā)展,。事實(shí)上,開源模型對(duì)全球AI供應(yīng)鏈至關(guān)重要,,尤其是發(fā)展中國家,。若美國繼續(xù)設(shè)置障礙,中國有望在開源AI全球供應(yīng)鏈中占據(jù)核心地位,。真正的AI競(jìng)爭(zhēng)不僅是技術(shù)和模型的競(jìng)爭(zhēng),,更是生態(tài)系統(tǒng)、商業(yè)模式和價(jià)值觀的競(jìng)爭(zhēng),。開源戰(zhàn)略將證明誰擁抱開源,,誰就能贏得未來。
有人認(rèn)為ChatGPT是0到1的突破,,而DeepSeek只是1到N的擴(kuò)展,,但這不符合人工智能發(fā)展歷史,。中國企業(yè)在應(yīng)用創(chuàng)新和商業(yè)模式創(chuàng)新方面表現(xiàn)出色,,但原創(chuàng)能力逐漸增強(qiáng)。DeepSeek可能標(biāo)志著中國AI產(chǎn)業(yè)從“技術(shù)跟跑”向“技術(shù)并跑和領(lǐng)跑”邁進(jìn),。
盡管中國在人工智能基礎(chǔ)研究和核心技術(shù)上仍與美國有差距,,但在論文發(fā)表總數(shù)和專利授權(quán)數(shù)量上超過美國。近年來中國進(jìn)步迅速,根據(jù)統(tǒng)計(jì),,中國作者在過去四年增長了8倍,。人工智能產(chǎn)業(yè)具有不對(duì)稱性,一個(gè)小企業(yè)可以挑戰(zhàn)市值上萬億的龍頭企業(yè),。中國已有52家人工智能獨(dú)角獸企業(yè),,占全球18%。這表明中國已有一批創(chuàng)新型小企業(yè)進(jìn)入世界前列,。
DeepSeek的成功說明算法優(yōu)化和系統(tǒng)級(jí)工程優(yōu)化不可或缺,,優(yōu)秀工程師發(fā)揮著重要作用。良好的工程教育體系和龐大的工程師隊(duì)伍是中國的優(yōu)勢(shì),。年輕一代正成為科研主力,,有信心在人工智能研究和應(yīng)用上走在前面。
實(shí)現(xiàn)人工智能自立自強(qiáng)不僅靠國家規(guī)劃和資金支持,,更要做好人才使用培養(yǎng)和產(chǎn)業(yè)生態(tài)構(gòu)建,。DeepSeek創(chuàng)始人梁文鋒強(qiáng)調(diào)自信,選擇初出茅廬的年輕人,,拒絕經(jīng)驗(yàn)豐富的人才,。這種用人理念為公司帶來創(chuàng)新動(dòng)力,對(duì)傳統(tǒng)教育和聘用模式提出警示,。
構(gòu)建自主可控的產(chǎn)業(yè)生態(tài)是最困難的任務(wù),。英偉達(dá)的CUDA軟件生態(tài)是其護(hù)城河,DeepSeek沖擊了這一生態(tài)但未完全繞過,。長遠(yuǎn)來看,,需要開發(fā)一套自主可控的AI軟件工具系統(tǒng),重構(gòu)AI軟件生態(tài),。這需要周密規(guī)劃和長期努力,,相關(guān)部門應(yīng)組織全國力量完成這一任務(wù)。
資金投入雖非決定因素,,但中國投資市場(chǎng)規(guī)模急劇萎縮值得關(guān)注,。2023年美國AI投資達(dá)到672億美元,是中國的8.7倍,。風(fēng)險(xiǎn)投資和私募基金對(duì)科創(chuàng)產(chǎn)業(yè)極為重要,,中美科創(chuàng)市場(chǎng)曾并駕齊驅(qū),但2023年中國投資額僅相當(dāng)于美國的8%,。政府和資本界需合力構(gòu)建健康的科創(chuàng)金融生態(tài),,為創(chuàng)新提供動(dòng)力。
產(chǎn)業(yè)生態(tài)形成需市場(chǎng)牽引,,國家應(yīng)通過政策引導(dǎo)推廣AI應(yīng)用,,增強(qiáng)國產(chǎn)硬件和軟件市場(chǎng)占有率。重視芯片設(shè)計(jì)和大模型開源戰(zhàn)略,爭(zhēng)取中國在全球人工智能開源系統(tǒng)中的主導(dǎo)作用,。通過算法和軟件協(xié)同創(chuàng)新,,充分發(fā)揮硬件性能,力爭(zhēng)中國人工智能科研和應(yīng)用走在世界前列,。
人工智能(AI)大模型DeepSeek點(diǎn)燃的AI熱潮,正在引發(fā)全球資本流向中國,。
2025-02-17 10:11:09DeepSeek推動(dòng)中國股票價(jià)值增1.3萬億美元