由DeepSeek點燃的人工智能熱潮仍在持續(xù),。面對這場熱鬧異常的“AI春節(jié)檔”,,全球大模型市場內(nèi)的玩家們都在加速行動。近日,,商湯科技聯(lián)合創(chuàng)始人,、執(zhí)行董事及人工智能基礎(chǔ)設(shè)施和大模型首席科學(xué)家林達華在一場閉門交流會上談及了對DeepSeek的看法、算力需求,、未來AI技術(shù)路徑以及商湯未來的大模型計劃,。
林達華認(rèn)為,DeepSeek不會降低市場對算力的需求,,在可見的2025年內(nèi),,整體算力需求仍將保持增長。特別是隨著DeepSeek推理能力不斷突破,,它帶動了下游應(yīng)用市場的快速擴展,,推理市場正呈現(xiàn)供不應(yīng)求、快速增長的態(tài)勢。DeepSeek是開源路線的堅持者,,因此它的出圈也被認(rèn)為是開源的勝利,。開源不僅改變了全球AI和大模型的產(chǎn)業(yè)格局,還加速了技術(shù)的傳播和普及,。開源模型的追趕速度非??欤c頂尖閉源模型的差距正在迅速縮小,。未來,,大模型應(yīng)用將從問答、文本改寫等淺層工具轉(zhuǎn)向替代行業(yè)中高價值的核心任務(wù),。大模型需要在特定行業(yè)任務(wù)上突破工業(yè)紅線,,才能實現(xiàn)規(guī)模化應(yīng)用,。開源只是技術(shù)價值鏈中的一環(huán),,而非全部。
關(guān)于DeepSeek的突破,,林達華指出,,DeepSeek有兩個近期的版本:V3基礎(chǔ)模型和R1推理模型。V3的核心亮點在于模型和系統(tǒng)垂直整合后的訓(xùn)練效率優(yōu)化,;而R1則是構(gòu)建強推理能力的新算法路徑,。V3整體表現(xiàn)優(yōu)秀,綜合能力強,,且在多項評測中表現(xiàn)突出,。這主要歸功于數(shù)據(jù)的多樣性和高質(zhì)量處理以及高效的訓(xùn)練方法。R1則采用了MoE架構(gòu),,并通過負(fù)載均衡策略提升了訓(xùn)練效率,。此外,R1選擇了基于結(jié)果監(jiān)督的強化學(xué)習(xí)路線,,這一路徑在內(nèi)外部交叉驗證中證明了其有效性,。
對于DeepSeek的高效訓(xùn)練是否會顯著降低市場對算力的需求,林達華表示,,算力需求不會下降,。盡管單次訓(xùn)練成本得到了優(yōu)化,但市場競爭白熱化,,效率的優(yōu)化會加快迭代,,總體需求不會減少。隨著DeepSeek推理能力的突破,,下游應(yīng)用市場快速擴展,,推理市場呈現(xiàn)供不應(yīng)求,、快速增長的態(tài)勢。
最近,DeepSeek在國內(nèi)外引起廣泛關(guān)注,,其創(chuàng)始人梁文鋒也成為了焦點人物,。梁文鋒來自廣東省湛江市吳川市,今年春節(jié)他回到了老家過年
2025-01-31 08:17:17DeepSeek創(chuàng)始人家鄉(xiāng)拉橫幅歡迎游客