除了性能卓越,,DeepSeek的成本也極為低廉,。R1模型的查詢成本僅為每百萬個(gè)token 0.14美元,而OpenAI的成本為7.50美元,,使其成本降低了98%,。DeepSeek僅用兩個(gè)月時(shí)間,耗費(fèi)不到600萬美元就打造了大語言模型R1,,使用的還是性能較弱的英偉達(dá)H800芯片,。這種低成本和高效率讓硅谷巨頭們感到震驚。
DeepSeek團(tuán)隊(duì)主要由北大,、清華等頂級(jí)高校的博士生組成,,許多人曾在頂級(jí)學(xué)術(shù)期刊發(fā)表論文并獲獎(jiǎng)。這種招聘策略有助于營(yíng)造自由協(xié)作的文化,,研究人員可以利用充足的計(jì)算資源進(jìn)行創(chuàng)新研究,。
面對(duì)DeepSeek的崛起,一些硅谷巨頭表達(dá)了不同的看法,。OpenAI創(chuàng)始人奧特曼認(rèn)為復(fù)制已知有效的方案相對(duì)容易,,探索未知領(lǐng)域則充滿挑戰(zhàn),。Perplexity AI的CEO斯林尼瓦斯表示,DeepSeek在很大程度上復(fù)制了OpenAI的技術(shù)并開源了它,,但他也贊嘆了DeepSeek的快速步伐,。Stability AI的創(chuàng)始人Mostaque暗示DeepSeek給資金更充裕的競(jìng)爭(zhēng)對(duì)手帶來了壓力。Meta AI首席科學(xué)家楊立昆強(qiáng)調(diào),,DeepSeek的成功證明了開源模型正在超越閉源系統(tǒng),。
DeepSeek通過一系列工程技術(shù)優(yōu)化了模型架構(gòu),包括定制化芯片間通信方案,、減少字段大小以節(jié)省內(nèi)存,,以及創(chuàng)新性地使用專家混合模型方法。這些技術(shù)使DeepSeek的模型更具成本效益,,訓(xùn)練所需的計(jì)算資源遠(yuǎn)少于競(jìng)爭(zhēng)對(duì)手,。DeepSeek R1是一個(gè)轉(zhuǎn)折點(diǎn),因?yàn)樗饕ㄟ^機(jī)械強(qiáng)化學(xué)習(xí)進(jìn)行學(xué)習(xí),,而不是依賴大量監(jiān)督數(shù)據(jù),。
DeepSeek愿意將其創(chuàng)新成果開源,得到了全球AI研究社區(qū)的高度贊賞,。英偉達(dá)資深研究員樊錦贊揚(yáng)了DeepSeek的透明度,,并指出其強(qiáng)化學(xué)習(xí)方法的重要性??萍计髽I(yè)家Arnaud Bertrand認(rèn)為,,競(jìng)爭(zhēng)性開源模型的出現(xiàn)可能對(duì)OpenAI的商業(yè)模式造成沖擊。
DeepSeek的崛起對(duì)英偉達(dá)來說是一個(gè)利空因素,。由于美國(guó)政府的AI芯片禁運(yùn),,中國(guó)無法采購(gòu)英偉達(dá)最高性能的AI芯片,而H800則是高算力A100芯片的閹割版,。盡管如此,,DeepSeek依然成功地訓(xùn)練出了強(qiáng)勁的大模型。未來,,中國(guó)AI行業(yè)可能會(huì)面臨更多挑戰(zhàn),,尤其是在芯片和出口管制方面。
過去一周,,中國(guó)的人工智能大模型成為硅谷乃至全球科技界的熱議話題。引發(fā)這場(chǎng)討論的是中國(guó)人工智能初創(chuàng)公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震驚硅谷短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強(qiáng)在哪短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌短短一個(gè)月內(nèi),,中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外短短一個(gè)月內(nèi),中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:52:31DeepSeek刷屏硅谷背后