DeepSeek如何以顛覆性訓(xùn)練策略重構(gòu)大型參數(shù)模型的成本公式,?1月底,,美國知名半導(dǎo)體咨詢機構(gòu)SemiAnalysis發(fā)布了一篇關(guān)于“給Deepseek算經(jīng)濟賬”的文章,引起了廣泛關(guān)注,。近日,,心智觀察所與SemiAnalysis的總裁Dylan Patel、資深分析師AJ Kourabi和David Wolfson就全球LLM模型競爭生態(tài),、穿透算力軍備競賽表象以及大模型博弈中數(shù)據(jù),、算法、資本的三重角力等問題進行了深入討論,。
心智觀察所提到,,SemiAnalysis早在去年五月就發(fā)現(xiàn)了DeepSeek在MoE、RoPE,、Attention等領(lǐng)域的創(chuàng)新貢獻,。SemiAnalysis表示,他們一直密切關(guān)注AI領(lǐng)域的創(chuàng)新和進展,,對DeepSeek取得的進步印象深刻,。大多數(shù)領(lǐng)先的AI實驗室并沒有忽視DeepSeek——Anthropic的CEO公開表示,他們從V2甚至更早的時候就開始跟蹤DeepSeek的發(fā)展,。大多數(shù)實驗室都預(yù)計到了從V2到V3會有這種程度的改進,,除了Meta。
心智觀察所詢問了TCO模型(總計算成本)的搭建情況,。SemiAnalysis回應(yīng)稱,,他們開發(fā)了自己獨有的解決方案,,并與多家公司合作,提供咨詢服務(wù)以支持他們的集群建設(shè),。
對于Meta AI是否可能對Google搜索造成沖擊的問題,,SemiAnalysis認(rèn)為,Meta擁有直接接觸數(shù)十億日活躍用戶的能力,,使他們能夠立即將大量用戶群體調(diào)用于他們引入的任何AI功能,。
關(guān)于未來DeepSeek的競爭態(tài)勢,SemiAnalysis預(yù)計OpenAI憑借其在人才,、基礎(chǔ)設(shè)施和資本方面的卓越資源,,將保持領(lǐng)先地位。DeepSeek正在利用一種新范式,,通過瞄準(zhǔn)低垂果實實現(xiàn)快速且成本效益高的進展,。然而,隨著格局的演變,,保持這種勢頭將變得越來越具有挑戰(zhàn)性,。同樣,,他們也預(yù)計Google將保持領(lǐng)先地位,。Anthropic擁有顯著優(yōu)于DeepSeek的模型,預(yù)計將在不久的將來公開發(fā)布,。Meta處于更具挑戰(zhàn)性的位置,,因為他們是唯一一個致力于開源其模型的主要實驗室。據(jù)SemiAnalysis了解,,Meta正在開發(fā)一個新模型,,預(yù)計其性能將超過DeepSeek,但改進的程度是否足以證明推遲發(fā)布是合理的,,這一點仍不確定,。
心智觀察所還詢問了DeepSeek的崛起對英偉達H200銷售預(yù)期的影響。SemiAnalysis表示,,DeepSeek推動了AI擴展的創(chuàng)新,,證明了戰(zhàn)略性優(yōu)化可以帶來有競爭力的結(jié)果。他們的進展增加了對AI基礎(chǔ)設(shè)施和計算資源的需求,,同時加劇了頂級實驗室之間的競爭,,進一步加速了該領(lǐng)域的進展。
關(guān)于推理成本下降的問題,,SemiAnalysis認(rèn)為許多頂級AI實驗室正在積極開發(fā)針對降低成本的創(chuàng)新,。當(dāng)競爭對手提供更低的價格時,供應(yīng)商不得不通過調(diào)整定價來應(yīng)對,。通常,,API定價策略會根據(jù)市場壓力和推動成本下降的內(nèi)部進展進行調(diào)整,。然而,在某些情況下,,供應(yīng)商并沒有降低價格,,而是擴大了對替代性模型的訪問。SemiAnalysis認(rèn)為“杰文斯悖論”并沒有被低估,,并且他們之前的研究已經(jīng)廣泛覆蓋了這個話題,。
對于OpenAI領(lǐng)導(dǎo)的“Stargate”計劃,SemiAnalysis指出,,該計劃與芯片法案完全獨立,,因為它專注于擴展AI基礎(chǔ)設(shè)施,而不是對半導(dǎo)體制造端的激勵,。雖然兩者都涉及大量資源動員,,但Stargate是一項私有部門的努力,旨在構(gòu)建先進的AI系統(tǒng),,而芯片法案是一項政府計劃,,旨在提升國內(nèi)芯片產(chǎn)量。兩者之間沒有直接聯(lián)系,。
最后,,心智觀察所詢問了SemiAnalysis的方法論及其團隊規(guī)模和盈利模式。SemiAnalysis表示,,他們的方法基于對制造業(yè),、供應(yīng)鏈、技術(shù)部署以及AI基礎(chǔ)設(shè)施戰(zhàn)略的嚴(yán)格研究,。這項工作需要一個高度敬業(yè)的團隊,,他們對技術(shù)和分析充滿熱情。隨著服務(wù)的擴展,,團隊也在不斷壯大,,目前約有25名分析師分布于北美、歐洲和亞洲,。SemiAnalysis沒有“中央辦公室”,,其盈利模式基于銷售行業(yè)和金融研究,客戶范圍從初創(chuàng)公司到全球財富100強公司,,技術(shù)公司和投資公司各占一半,。業(yè)務(wù)范圍包括簡單的新聞通訊訂閱到與專門分析師進行為期數(shù)月的咨詢服務(wù)等。
近日,美國多名官員對DeepSeek的影響表示擔(dān)憂,,稱其為“偷竊”,,并正在對其展開國家安全調(diào)查
2025-01-31 11:49:55周鴻祎