行業(yè)普遍認為,,兩大“AI巨頭”都被DeepSeek卷入了競爭,,開源的勝利正在改變AI世界。自走紅以來,,DeepSeek因成本優(yōu)勢不斷震驚業(yè)界,為其開源生態(tài)的發(fā)展奠定了良好基礎(chǔ),。
過去,,大模型多走閉源路線,這與高昂的成本密切相關(guān),。許多大模型在預訓練階段幾乎不計成本地投入,,而DeepSeek則選擇了一條不同的道路,將重點放在強化學習上,。通過反復高強度訓練,,不斷調(diào)整和優(yōu)化,直到結(jié)果令人滿意,。例如,,OpenAI的GPT-5項目一次為期半年的訓練計算成本高達約5億美元,但仍未取得預期成果,。相比之下,,DeepSeek找到了一條低算力、高效率的路徑,,其訓練成本僅為OpenAI相關(guān)模型的十幾分之一甚至幾十分之一,。
DeepSeek不僅開源了所有模型和論文,還公開了訓練方法,,允許全球技術(shù)人員進行研發(fā)和開發(fā),。這意味著新的技術(shù)和應用將在這一新生態(tài)中不斷涌現(xiàn),。2025年1月20日,DeepSeek發(fā)布R1模型后,,僅7天新增用戶達1億,,成為史上最快破億的AI應用。至2月1日,,其日活躍用戶突破3000萬,,超越豆包,逼近ChatGPT的5323萬,。
從云服務商,、電信運營商到手機和汽車廠商,越來越多的企業(yè)開始擁抱DeepSeek,。這條鯰魚也攪動了全球AI市場,,促使兩大“AI巨頭”先后決定開放部分功能。1月31日,,OpenAI上線了新的推理模型o3-mini,,并進一步下放免費權(quán)限。OpenAI CEO Sam Altman承認在開源上的失誤,,并表示可能找到新的開源策略,。百度也在2月13日宣布,從4月1日起文心一言將全面免費,,并即日起上線深度搜索功能,,該功能也將于4月1日起免費開放使用。
DeepSeek之所以能夠高效運行,,一個重要原因是實現(xiàn)了芯片最底層的優(yōu)化。通過PTX編程,,DeepSeek優(yōu)化了GPU的數(shù)據(jù)傳輸速度和其他運算,,使同樣的GPU發(fā)揮出10倍效能。此外,,DeepSeek在訓練方法上也進行了創(chuàng)新,,跳過監(jiān)督微調(diào)階段,專注于規(guī)則驅(qū)動的強化學習,。研究團隊采用了一種名為GRPO的方法,,這種方法使得整個團隊共同進步,變得更加準確和一致,。
DeepSeek的研發(fā)團隊有139人,,均是立足本土的年輕團隊。母公司幻方量化在AI領(lǐng)域押寶已久,,擁有豐富的資源,。早在2019年就花費2億打造超算集群,,并在2022年囤積了大量A100顯卡。這些積累增強了DeepSeek的信心,,使其在V3實現(xiàn)了震撼的性價比,,R1不僅實現(xiàn)了性價比,還跑通了影響很大的新范式,,成為AI領(lǐng)域的新星,。
DeepSeek的成功案例再次證明,在AI競賽中,,垂直突破,、開放協(xié)作和長期主義是贏得競爭的關(guān)鍵。它掀起的人工智能革命浪潮也改變了中國科技企業(yè)的估值敘事,。恒生科技指數(shù)ETF近一周累計上漲7.67%,,高盛預計MSCI中國指數(shù)今年將上漲14%。此前,,中國科技企業(yè)一直被低估,,但現(xiàn)在DeepSeek的出現(xiàn)激發(fā)了投資者對中國股票的熱情。美國媒體將其稱為“斯普特尼克時刻”,,認為DeepSeek在AI領(lǐng)域的崛起給美國帶來了巨大的危機感和緊迫感,。