這幾天,中國人工智能初創(chuàng)公司DeepSeek在美區(qū)下載榜上超越了ChatGPT,還引發(fā)多個美國科技股股價暴跌,。美國總統(tǒng)特朗普稱DeepSeek的出現(xiàn)“給美國相關(guān)產(chǎn)業(yè)敲響了警鐘”。
DeepSeek用較少的資金實現(xiàn)了與世界頂尖大模型如GPT-4相媲美的性能,。OpenAI訓(xùn)練ChatGPT-4的成本高達7800萬美元甚至可能達到1億美元,而DeepSeek的大模型訓(xùn)練成本不到600萬美元,僅為同性能模型的5%到10%。新模型訓(xùn)練方法大幅降低了大模型行業(yè)的入局門檻,,使得大規(guī)模預(yù)訓(xùn)練不再是科技巨頭的專利。此外,,在模型推理層面,,DeepSeek推出的DeepSeek-R1價格為2.2美元/百萬詞元,而同性能的OpenAI-o1價格為60美元/百萬詞元,,前者僅為后者的三十分之一。這種低成本顯著改善了大模型的應(yīng)用成本,,對科研,、企業(yè)等智力密集型產(chǎn)業(yè)具有重大價值。因此,,無論是從基礎(chǔ)研究角度還是商業(yè)層面上看,,DeepSeek對美國一些大模型公司的既有模式構(gòu)成了沖擊。
DeepSeek開發(fā)成本大幅降低的原因在于其應(yīng)用了不同的模型訓(xùn)練模式,,打破了美國堆砌算力的方式,。在數(shù)據(jù)喂養(yǎng)這一重要環(huán)節(jié)上,OpenAI選擇了“人海戰(zhàn)術(shù)”,,通過海量數(shù)據(jù)投喂提升能力,。而DeepSeek則利用算法對數(shù)據(jù)進行總結(jié)和分類,經(jīng)過選擇性處理后再輸送給大模型,,從而優(yōu)化了算力并降低了成本,。目前來看,Meta耗費大量資金訓(xùn)練Llama,但效果不如成本極低的DeepSeek,。這引發(fā)了Meta高層和技術(shù)人員的恐慌,,他們擔心自己的技術(shù)能力和創(chuàng)新性被質(zhì)疑,從而失去工作,。社交媒體上的討論也顯示,,關(guān)于DeepSeek的帖子數(shù)量遠高于新聞報道,且討論時間早于新聞媒體五天,,這主要是由從事科技工作的自媒體人和員工圈層傳播所致,。
DeepSeek服務(wù)再次出現(xiàn)“宕機”,。1月27日11點左右,,DeepSeek官網(wǎng)一度顯示網(wǎng)頁和API不可用,但功能隨后恢復(fù)
2025-01-28 08:17:11DeepSeek又崩了中國AI初創(chuàng)公司深度求索(DeepSeek)在短短一個月內(nèi)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 19:35:39DeepSeek為何引發(fā)全球轟動