DeepSeek梁文鋒的第一桶金,。春節(jié)期間,國產(chǎn)AI獨角獸DeepSeek意外走紅,其創(chuàng)始人梁文鋒的家鄉(xiāng)廣東湛江吳川覃巴鎮(zhèn)米歷嶺村吸引了眾多游客前來“打卡”,。甚至有建筑風水師拿著羅盤研究起村莊和梁文鋒家宅的布局,,科技與玄學(xué)在此巧妙結(jié)合,。
在國內(nèi)大廠和國際巨頭紛紛押注AI大模型的背景下,,由量化私募公司幻方孵化的DeepSeek憑借“能用,、好用,、用得起”的口碑悄然滲透市場,。盡管團隊核心成員僅百余人且沒有大規(guī)模發(fā)布會,但其崛起不僅引發(fā)美國科技股大幅下跌,,還迫使行業(yè)掀起價格戰(zhàn),。梁文鋒本人因豪捐上億善款及拒絕資本裹挾的姿態(tài),成為中國AI領(lǐng)域的一股清流,。
DeepSeek的春節(jié)走紅充滿草根性,。一方面,技術(shù)下沉讓縣城中學(xué)可以用老舊機房開展AI教學(xué),,縣城程序員也能調(diào)試代碼,。開源的數(shù)學(xué)推理模型被中小科技公司接入業(yè)務(wù)系統(tǒng)。另一方面,,極致性價比使得API調(diào)用價格低至0.14元/萬token,,僅為行業(yè)均價的1/20。河南某農(nóng)產(chǎn)品電商借此將智能客服成本壓縮92%,。
支撐這種性價比的是幻方從量化交易中提煉出的技術(shù)哲學(xué)——自研“動態(tài)計算圖”技術(shù)使同一批GPU可并行訓(xùn)練3個模型,,硬件利用率達89%,遠高于行業(yè)平均水平,。訓(xùn)練數(shù)據(jù)清洗引入量化風控模型,,將無效數(shù)據(jù)標記率提升至93%,,百億參數(shù)模型訓(xùn)練成本控制在800萬元內(nèi)。不同于大廠追求萬億參數(shù)競賽,,DeepSeek專注提升單位算力產(chǎn)出效率,。其13B參數(shù)模型在法律文書審核場景擊敗多家千億級大模型,這得益于幻方團隊多年處理金融法律文本的經(jīng)驗遷移,。