標(biāo)桿資本普通合伙人切坦·普塔貢塔認(rèn)為,,深度求索采用預(yù)訓(xùn)練大型模型,,并利用蒸餾技術(shù)提升小型模型的能力,,這是一種非常具有成本效益的方法,。
其他中國AI模型也在有限資源下取得了顯著成績,。例如,,李開復(fù)的初創(chuàng)公司零一萬物成立八個(gè)月就成為獨(dú)角獸企業(yè),,2024年創(chuàng)造近1400萬美元收入,,其模型訓(xùn)練成本僅為300萬美元,。阿里巴巴的千問也大幅降低了大型語言模型的成本,。
美國AI初創(chuàng)企業(yè)Perplexity首席執(zhí)行官阿拉文德·斯里尼瓦斯表示,需求是發(fā)明之母,,由于必須想出變通辦法,,最終構(gòu)建出了效率更高的系統(tǒng)。
《紐約時(shí)報(bào)》報(bào)道指出,深度求索開發(fā)的AI系統(tǒng)可與OpenAI和谷歌等公司的尖端聊天機(jī)器人相媲美,。DeepSeek-V3大模型的訓(xùn)練只用了領(lǐng)先人工智能公司用的高度專業(yè)化計(jì)算機(jī)芯片的一小部分,。自ChatGPT發(fā)布以來,許多專家和投資者普遍認(rèn)為,,不投入數(shù)億美元購買人工智能專用芯片的話,,沒有公司能與行業(yè)領(lǐng)軍者競爭。然而,,DeepSeek僅用了約2000個(gè)英偉達(dá)生產(chǎn)的專用芯片,。
喬治華盛頓大學(xué)助理教授杰弗里·丁表示,中國進(jìn)口芯片受到限制,,迫使DeepSeek工程師更有效地訓(xùn)練大模型,,使其仍有競爭力。多倫多的技術(shù)顧問魯文·科恩表示,,DeepSeek-V3與OpenAI,、谷歌和Anthropic的最新系統(tǒng)能力相當(dāng),而且使用起來便宜得多,。
美國喬治梅森大學(xué)經(jīng)濟(jì)系教授泰勒·考恩認(rèn)為,,美國限制對華出口芯片,間接導(dǎo)致了中國重要創(chuàng)新的出現(xiàn),。南加州大學(xué)古爾德法學(xué)院法學(xué)教授張湖月提到,,中國在效率方面的成就并非偶然,這是對美國及其盟友不斷升級的出口限制的直接回應(yīng),。嚴(yán)格的出口管制反而促使中國科技公司變得更加自力更生,,推動了原本可能不會發(fā)生的突破。