行業(yè)普遍認(rèn)為,兩大“AI巨頭”都被DeepSeek卷入了競爭,,開源的勝利正在改變AI世界,。自走紅以來,DeepSeek因成本優(yōu)勢不斷震驚業(yè)界,,為其開源生態(tài)的發(fā)展奠定了良好基礎(chǔ),。
過去,大模型多走閉源路線,,這與高昂的成本密切相關(guān),。許多大模型在預(yù)訓(xùn)練階段幾乎不計成本地投入,而DeepSeek則選擇了一條不同的道路,,將重點放在強化學(xué)習(xí)上,。通過反復(fù)高強度訓(xùn)練,不斷調(diào)整和優(yōu)化,,直到結(jié)果令人滿意,。例如,,OpenAI的GPT-5項目一次為期半年的訓(xùn)練計算成本高達約5億美元,但仍未取得預(yù)期成果,。相比之下,,DeepSeek找到了一條低算力、高效率的路徑,,其訓(xùn)練成本僅為OpenAI相關(guān)模型的十幾分之一甚至幾十分之一,。
DeepSeek不僅開源了所有模型和論文,還公開了訓(xùn)練方法,,允許全球技術(shù)人員進行研發(fā)和開發(fā),。這意味著新的技術(shù)和應(yīng)用將在這一新生態(tài)中不斷涌現(xiàn)。2025年1月20日,,DeepSeek發(fā)布R1模型后,,僅7天新增用戶達1億,成為史上最快破億的AI應(yīng)用,。至2月1日,,其日活躍用戶突破3000萬,超越豆包,,逼近ChatGPT的5323萬,。
從云服務(wù)商、電信運營商到手機和汽車廠商,,越來越多的企業(yè)開始擁抱DeepSeek,。這條鯰魚也攪動了全球AI市場,促使兩大“AI巨頭”先后決定開放部分功能,。1月31日,,OpenAI上線了新的推理模型o3-mini,并進一步下放免費權(quán)限,。OpenAI CEO Sam Altman承認(rèn)在開源上的失誤,,并表示可能找到新的開源策略。百度也在2月13日宣布,,從4月1日起文心一言將全面免費,,并即日起上線深度搜索功能,該功能也將于4月1日起免費開放使用,。
DeepSeek之所以能夠高效運行,,一個重要原因是實現(xiàn)了芯片最底層的優(yōu)化。通過PTX編程,,DeepSeek優(yōu)化了GPU的數(shù)據(jù)傳輸速度和其他運算,,使同樣的GPU發(fā)揮出10倍效能。此外,DeepSeek在訓(xùn)練方法上也進行了創(chuàng)新,,跳過監(jiān)督微調(diào)階段,,專注于規(guī)則驅(qū)動的強化學(xué)習(xí)。研究團隊采用了一種名為GRPO的方法,,這種方法使得整個團隊共同進步,,變得更加準(zhǔn)確和一致。