近期,,中國(guó)人工智能公司深度求索(DeepSeek)開(kāi)發(fā)的AI模型引起了西方業(yè)界的高度關(guān)注,。各大西方媒體、AI團(tuán)隊(duì)及投資者紛紛探討,,在缺乏頂尖芯片的情況下,,中國(guó)如何以更低的成本創(chuàng)造出能與美國(guó)頂尖AI模型相媲美的產(chǎn)品,。
美國(guó)消費(fèi)者新聞與商業(yè)頻道(CNBC)報(bào)道指出,深度求索發(fā)布的AI模型不僅性能超越美國(guó)同類模型,,而且構(gòu)建成本更低,,所用芯片算力也較弱。這一消息在硅谷引發(fā)恐慌,,讓美國(guó)人開(kāi)始質(zhì)疑美國(guó)在全球人工智能領(lǐng)域的領(lǐng)先地位是否正在縮小,,以及科技巨頭在構(gòu)建人工智能模型和數(shù)據(jù)中心上的巨額投入是否值得。
去年12月底,,深度求索推出了一款免費(fèi)開(kāi)源的大語(yǔ)言模型DeepSeek-V3,。該模型僅用了兩個(gè)月時(shí)間,花費(fèi)不到600萬(wàn)美元,,使用英偉達(dá)H800芯片構(gòu)建而成,。相比之下,谷歌和OpenAI則花費(fèi)了數(shù)年時(shí)間和數(shù)億美元才取得類似成果,。DeepSeek的開(kāi)源模型已成為許多美國(guó)開(kāi)發(fā)者的基礎(chǔ),。
在一系列第三方基準(zhǔn)測(cè)試中,深度求索的模型在解決復(fù)雜問(wèn)題,、數(shù)學(xué)和編程等方面表現(xiàn)優(yōu)于Meta的Llama 3.1,、OpenAI的GPT-4和Anthropic的Claude Sonnet 3.5。其最新發(fā)布的推理模型DeepSeek-R1同樣超越了OpenAI的最新模型o1,。
微軟首席執(zhí)行官薩蒂亞·納德拉在達(dá)沃斯世界經(jīng)濟(jì)論壇上表示,,深度求索的新模型令人印象深刻,他們高效地開(kāi)發(fā)出一款開(kāi)源模型,,在推理計(jì)算方面表現(xiàn)出色,,計(jì)算效率極高,。這些進(jìn)展需要被嚴(yán)肅對(duì)待。
值得注意的是,,這些成就是在美國(guó)政府對(duì)中國(guó)實(shí)施嚴(yán)格半導(dǎo)體限制的情況下取得的,。這些限制使中國(guó)無(wú)法獲取最強(qiáng)大的芯片,如英偉達(dá)H100,。這表明要么深度求索找到了繞過(guò)相關(guān)規(guī)則的方法,,要么美國(guó)的出口管制并未達(dá)到預(yù)期效果。
標(biāo)桿資本普通合伙人切坦·普塔貢塔認(rèn)為,,深度求索采用預(yù)訓(xùn)練大型模型,,并利用蒸餾技術(shù)提升小型模型的能力,這是一種非常具有成本效益的方法,。
大熊貓“寶力”“青寶”將赴美國(guó),,美國(guó)輿論對(duì)此表示歡迎,。
2024-10-15 16:18:20美媒歡呼熊貓來(lái)了熊貓來(lái)了