DeepSeek如何以顛覆性訓(xùn)練策略重構(gòu)大型參數(shù)模型的成本公式?1月底,,美國知名半導(dǎo)體咨詢機(jī)構(gòu)SemiAnalysis發(fā)布了一篇關(guān)于“給Deepseek算經(jīng)濟(jì)賬”的文章,,引起了廣泛關(guān)注,。近日,心智觀察所與SemiAnalysis的總裁Dylan Patel,、資深分析師AJ Kourabi和David Wolfson就全球LLM模型競(jìng)爭(zhēng)生態(tài)、穿透算力軍備競(jìng)賽表象以及大模型博弈中數(shù)據(jù)、算法,、資本的三重角力等問題進(jìn)行了深入討論。
心智觀察所提到,,SemiAnalysis早在去年五月就發(fā)現(xiàn)了DeepSeek在MoE,、RoPE、Attention等領(lǐng)域的創(chuàng)新貢獻(xiàn),。SemiAnalysis表示,,他們一直密切關(guān)注AI領(lǐng)域的創(chuàng)新和進(jìn)展,對(duì)DeepSeek取得的進(jìn)步印象深刻,。大多數(shù)領(lǐng)先的AI實(shí)驗(yàn)室并沒有忽視DeepSeek——Anthropic的CEO公開表示,,他們從V2甚至更早的時(shí)候就開始跟蹤DeepSeek的發(fā)展。大多數(shù)實(shí)驗(yàn)室都預(yù)計(jì)到了從V2到V3會(huì)有這種程度的改進(jìn),,除了Meta,。
心智觀察所詢問了TCO模型(總計(jì)算成本)的搭建情況。SemiAnalysis回應(yīng)稱,,他們開發(fā)了自己獨(dú)有的解決方案,,并與多家公司合作,,提供咨詢服務(wù)以支持他們的集群建設(shè)。
對(duì)于Meta AI是否可能對(duì)Google搜索造成沖擊的問題,,SemiAnalysis認(rèn)為,,Meta擁有直接接觸數(shù)十億日活躍用戶的能力,使他們能夠立即將大量用戶群體調(diào)用于他們引入的任何AI功能,。
近日,,美國多名官員對(duì)DeepSeek的影響表示擔(dān)憂,,稱其為“偷竊”,并正在對(duì)其展開國家安全調(diào)查
2025-01-31 11:49:55周鴻祎