行業(yè)普遍認(rèn)為,,兩大“AI巨頭”都被DeepSeek卷入了競(jìng)爭,,開源的勝利正在改變AI世界。自走紅以來,,DeepSeek因成本優(yōu)勢(shì)不斷震驚業(yè)界,為其開源生態(tài)的發(fā)展奠定了良好基礎(chǔ),。
過去,,大模型多走閉源路線,這與高昂的成本密切相關(guān),。許多大模型在預(yù)訓(xùn)練階段幾乎不計(jì)成本地投入,,而DeepSeek則選擇了一條不同的道路,將重點(diǎn)放在強(qiáng)化學(xué)習(xí)上,。通過反復(fù)高強(qiáng)度訓(xùn)練,,不斷調(diào)整和優(yōu)化,直到結(jié)果令人滿意,。例如,,OpenAI的GPT-5項(xiàng)目一次為期半年的訓(xùn)練計(jì)算成本高達(dá)約5億美元,但仍未取得預(yù)期成果,。相比之下,,DeepSeek找到了一條低算力、高效率的路徑,,其訓(xùn)練成本僅為OpenAI相關(guān)模型的十幾分之一甚至幾十分之一,。
DeepSeek不僅開源了所有模型和論文,還公開了訓(xùn)練方法,,允許全球技術(shù)人員進(jìn)行研發(fā)和開發(fā),。這意味著新的技術(shù)和應(yīng)用將在這一新生態(tài)中不斷涌現(xiàn)。2025年1月20日,DeepSeek發(fā)布R1模型后,,僅7天新增用戶達(dá)1億,,成為史上最快破億的AI應(yīng)用。至2月1日,,其日活躍用戶突破3000萬,,超越豆包,逼近ChatGPT的5323萬,。
從云服務(wù)商,、電信運(yùn)營商到手機(jī)和汽車廠商,越來越多的企業(yè)開始擁抱DeepSeek,。這條鯰魚也攪動(dòng)了全球AI市場(chǎng),,促使兩大“AI巨頭”先后決定開放部分功能。1月31日,,OpenAI上線了新的推理模型o3-mini,,并進(jìn)一步下放免費(fèi)權(quán)限。OpenAI CEO Sam Altman承認(rèn)在開源上的失誤,,并表示可能找到新的開源策略,。百度也在2月13日宣布,從4月1日起文心一言將全面免費(fèi),,并即日起上線深度搜索功能,,該功能也將于4月1日起免費(fèi)開放使用。
DeepSeek之所以能夠高效運(yùn)行,,一個(gè)重要原因是實(shí)現(xiàn)了芯片最底層的優(yōu)化,。通過PTX編程,DeepSeek優(yōu)化了GPU的數(shù)據(jù)傳輸速度和其他運(yùn)算,,使同樣的GPU發(fā)揮出10倍效能,。此外,DeepSeek在訓(xùn)練方法上也進(jìn)行了創(chuàng)新,,跳過監(jiān)督微調(diào)階段,,專注于規(guī)則驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí)。研究團(tuán)隊(duì)采用了一種名為GRPO的方法,,這種方法使得整個(gè)團(tuán)隊(duì)共同進(jìn)步,,變得更加準(zhǔn)確和一致。