364元就能開發(fā)DeepSeek模型,!近日,,一則關(guān)于AI的新聞在全球范圍內(nèi)引起了廣泛關(guān)注,。斯坦福大學(xué)和華盛頓大學(xué)的研究人員發(fā)表了一篇論文,,展示了他們以不到50美元(約364元)的云計算費(fèi)用訓(xùn)練出的一款名為S1的推理模型,。該模型在數(shù)學(xué)和編碼能力測試中表現(xiàn)優(yōu)異,,與OpenAI的o1和DeepSeek的R1不相上下,。
然而,,這并不意味著AI領(lǐng)域出現(xiàn)了重大突破,。實(shí)際上,S1模型并不是從零開始訓(xùn)練的,,而是基于阿里通義千問Qwen2.5-32B開源模型進(jìn)行開發(fā),,在16塊H100 GPU上進(jìn)行了26分鐘的監(jiān)督微調(diào),最終形成了新模型S1-32B,。此外,,研究人員還通過蒸餾技術(shù)從谷歌的AI推理模型Gemini 2.0中提取了推理能力。
有大模型廠商的研發(fā)人員指出,,S1模型本質(zhì)上是在前人研究的基礎(chǔ)上復(fù)制了推理能力,,并沒有實(shí)現(xiàn)真正的創(chuàng)新。盡管如此,,S1模型的出現(xiàn)還是給頭部大模型廠商帶來了警示,。如果頭部廠商投入大量資源訓(xùn)練出來的模型可以被他人用極少的資源復(fù)制并達(dá)到相似效果,那么這些廠商的競爭優(yōu)勢將面臨挑戰(zhàn),。
AI芯片巨頭英偉達(dá)公司發(fā)表聲明,,稱DeepSeek發(fā)布的新模型是一項(xiàng)出色的AI進(jìn)步,符合美國技術(shù)出口管制規(guī)定
2025-01-29 05:00:03英偉達(dá)回應(yīng)DeepSeek模型