關(guān)于通過擴(kuò)大模型規(guī)模推動進(jìn)步的觀點(diǎn)很多,但DeepSeek團(tuán)隊(duì)因美國AI芯片禁令不得不在性能較低的H800 GPU上運(yùn)行模型,,這促使他們在優(yōu)化方面進(jìn)行了大量創(chuàng)新,。最終,模型訓(xùn)練成本(不包括研究成本)不到600萬美元。吳恩達(dá)認(rèn)為,,即使智能變得更便宜,人類仍會使用更多智能,。
DeepSeek的成功引起了英特爾前CEO Pat Gelsinger的關(guān)注,。他認(rèn)為,針對DeepSeek的反應(yīng)忽視了計(jì)算機(jī)發(fā)展歷程中的三個教訓(xùn):計(jì)算遵循“氣體定律”,,工程的本質(zhì)是應(yīng)對約束,,以及開放終將勝利。DeepSeek展示了如何在資源受限的情況下以低得多的成本交付世界一流解決方案,。此外,,開放的研究和生態(tài)系統(tǒng)對于AI的未來發(fā)展至關(guān)重要。