DeepSeek能讓機(jī)器人“看穿”世界嗎改變AI競爭格局

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-29 02:40:47 澎湃新聞

中國大模型技術(shù)和產(chǎn)業(yè)鏈的發(fā)展速度顯著,，Deepseek和阿里巴巴在開源方面已經(jīng)領(lǐng)先Meta，成為全球開源領(lǐng)域的佼佼者,。目前,，國內(nèi)發(fā)布的推理模型效果基本與o1持平，盡管仍弱于o3,，但技術(shù)路線已經(jīng)走通，追上甚至趕超只是時間問題,。

DeepSeek的崛起為中國掌握下一代行業(yè)標(biāo)準(zhǔn)提供了機(jī)會,，甚至可能使美國的芯片禁令變得無效。關(guān)于DeepSeek是否能改變?nèi)駻I競爭格局的問題,，AGI短期內(nèi)不會實(shí)現(xiàn),，至少十年內(nèi)不會有全知全能的模型出現(xiàn)。因此,，各行業(yè)仍然需要根據(jù)具體需求定制多種模型,。訓(xùn)練模型的主要成本在于預(yù)訓(xùn)練階段，而后續(xù)訓(xùn)練階段的成本相對較低,。

傳統(tǒng)SFT階段,，模型只能從標(biāo)注樣本中學(xué)習(xí)知識，效果一般且容易過擬合,。DeepSeek V3開創(chuàng)了一種新范式：資金雄厚且具有理想主義色彩的公司可以訓(xùn)練更大更好的模型并開源,。各行業(yè)利用這些模型蒸餾出專用模型，再進(jìn)行微調(diào)或直接調(diào)用API,。這樣,，整個行業(yè)形成了一條分工協(xié)作的產(chǎn)業(yè)鏈，上下游企業(yè)各司其職,，發(fā)揮各自的優(yōu)勢,。

算力瓶頸問題也可以通過這種方式解決，因?yàn)橹挥写竽Ｐ皖A(yù)訓(xùn)練階段最消耗算力,，即使通過非常規(guī)手段也能應(yīng)對,。DeepSeek關(guān)聯(lián)公司杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司注冊資本1000萬元，法定代表人裴湉,，由寧波程恩企業(yè)管理咨詢合伙企業(yè)持股99%,，梁文鋒持股1%。

DeepSeek不僅完全開源,，還放出了詳細(xì)的技術(shù)報(bào)告,，并開源了最大671B R1模型及多個尺寸的蒸餾模型,，采用寬松的MIT License協(xié)議,，允許任何人免費(fèi)使用、修改,、分發(fā)，包括商業(yè)用途,。這種開放性使其受到廣泛支持，被譽(yù)為真正的OpenAI,。

DeepSeek的訓(xùn)練成本也出乎意料地低,，總訓(xùn)練成本僅為557.6萬美元。這使得其在大模型市場上的邏輯發(fā)生了根本變化,，過去認(rèn)為非常燒錢的事情現(xiàn)在變得不再那么昂貴。此外,，DeepSeek模型性能強(qiáng)大，在某些評測中甚至超越了GPT-4o和o1,。考慮到其免費(fèi)使用和低廉的API價(jià)格,，綜合用戶成本來看,，體驗(yàn)達(dá)到T1級別。

DeepSeek來自幻方量化而非傳統(tǒng)互聯(lián)網(wǎng)大廠,，更具理想主義氣息,。創(chuàng)始人梁文鋒近期備受關(guān)注，他的言論被逐字解讀,，增加了討論熱度,。相比之下，DeepSeek商業(yè)氣息較少,，更像是一個小而美的研究機(jī)構(gòu),。

美國明確表示要挑起AI競賽，特朗普宣布5000億美元投資星際之門計(jì)劃,，意圖遏制中國AI發(fā)展。在這種背景下,，中國企業(yè)推出DeepSeek，對國內(nèi)來說是振奮人心的消息,。DeepSeek不僅降低了訓(xùn)練成本，還在一定程度上削弱了對高性能顯卡的依賴,，這對美國來說難以接受,。未來，全世界的工程師可能會從Qwen和DeepSeek開始學(xué)習(xí)大模型,，或許這將是中國公司首次掌握互聯(lián)網(wǎng)基建標(biāo)準(zhǔn)的機(jī)會,。

(責(zé)任編輯：張蕾)

關(guān)閉

DeepSeek能讓機(jī)器人“看穿”世界嗎 改變AI競爭格局

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek能讓機(jī)器人“看穿”世界嗎改變AI競爭格局