問DeepSeek:孩子手機(jī)成癮的底層邏輯 創(chuàng)新突破算力禁運(yùn)!想象一下,,在世界廚藝錦標(biāo)賽上,,你和一群有夢想的年輕人在一個破舊的毛坯灶臺上,炒出了驚艷全球的創(chuàng)新菜,。而你的對手在五星級酒店里帶領(lǐng)豪華團(tuán)隊,,用著頂級廚具和豐富食材,,卻在比賽中惜敗于你,引發(fā)全球轟動,。這不是虛構(gòu)的故事,,這是正在發(fā)生的現(xiàn)實(shí)。你就是低調(diào)積累許久的“一代食神”——DeepSeek,。
年初,,DeepSeek App 橫空出世,其創(chuàng)新性的架構(gòu)設(shè)計和工程化落地使得模型性能在極低成本下達(dá)到全球頂尖水平,。加上用戶體驗良好的思維鏈展示和模型開源的方式,,春節(jié)期間用戶量迅速增長。這一現(xiàn)象不僅吸引了全球關(guān)注,,還促使全球資本重新評估中國科技資產(chǎn),,AI投資邏輯悄然轉(zhuǎn)變。特別是在大模型領(lǐng)域,,DeepSeek成為一匹黑馬,,挑戰(zhàn)了過去巨額投入但屢次推遲的ChatGPT5以及國內(nèi)六小龍的地位。中國AI企業(yè)在突破“算力禁運(yùn)”后,,正面臨高質(zhì)量數(shù)據(jù)稀缺的挑戰(zhàn),,尤其是高質(zhì)量、低成本,、多種類,、多模態(tài)的數(shù)據(jù),將成為未來AI產(chǎn)業(yè)發(fā)展的關(guān)鍵,。
主流的AI大模型訓(xùn)練方式基于Transformer進(jìn)行下一個Token的預(yù)測,,通過互聯(lián)網(wǎng)吸收海量數(shù)據(jù),并對匹配結(jié)果偏差較大的部分進(jìn)行人工打分或標(biāo)簽,,提升模型準(zhǔn)確性,。AI大模型的核心要素是數(shù)據(jù)、算法和算力,。當(dāng)前,,算力硬件性能已接近瓶頸,迭代速度遠(yuǎn)不及大模型日益增長的訓(xùn)練需求和能耗壓力,??晒╊A(yù)訓(xùn)練的數(shù)據(jù)也逐漸見頂,簡單增加數(shù)據(jù)和計算能力的時代已經(jīng)結(jié)束,。隨著大語言模型向多模態(tài)發(fā)展,,算力和數(shù)據(jù)的挑戰(zhàn)將進(jìn)一步加劇。
我國面臨美國的“芯片禁令”,,無法使用高端算力設(shè)備,,只能從算法和數(shù)據(jù)兩方面突圍,。過去普遍認(rèn)為我國與OpenAI等美國頭部AI公司存在1到2年的差距。根據(jù)CB Insights發(fā)布的數(shù)據(jù),,2024年中國AI初創(chuàng)企業(yè)籌集的資金僅占美國的7%,。豐厚的資金儲備意味著能高薪招攬頂尖人才,進(jìn)一步鞏固算法優(yōu)勢,。在DeepSeekV3之前,,我國人工智能領(lǐng)域的形勢嚴(yán)峻。