由DeepSeek點(diǎn)燃的人工智能熱潮仍在持續(xù)。面對這場熱鬧異常的“AI春節(jié)檔”,全球大模型市場內(nèi)的玩家們都在加速行動(dòng)。近日,商湯科技聯(lián)合創(chuàng)始人,、執(zhí)行董事及人工智能基礎(chǔ)設(shè)施和大模型首席科學(xué)家林達(dá)華在一場閉門交流會(huì)上談及了對DeepSeek的看法、算力需求,、未來AI技術(shù)路徑以及商湯未來的大模型計(jì)劃,。
林達(dá)華認(rèn)為,DeepSeek不會(huì)降低市場對算力的需求,,在可見的2025年內(nèi),,整體算力需求仍將保持增長。特別是隨著DeepSeek推理能力不斷突破,,它帶動(dòng)了下游應(yīng)用市場的快速擴(kuò)展,,推理市場正呈現(xiàn)供不應(yīng)求、快速增長的態(tài)勢,。DeepSeek是開源路線的堅(jiān)持者,,因此它的出圈也被認(rèn)為是開源的勝利。開源不僅改變了全球AI和大模型的產(chǎn)業(yè)格局,,還加速了技術(shù)的傳播和普及,。開源模型的追趕速度非常快,,與頂尖閉源模型的差距正在迅速縮小,。未來,大模型應(yīng)用將從問答,、文本改寫等淺層工具轉(zhuǎn)向替代行業(yè)中高價(jià)值的核心任務(wù),。大模型需要在特定行業(yè)任務(wù)上突破工業(yè)紅線,才能實(shí)現(xiàn)規(guī)?;瘧?yīng)用,。開源只是技術(shù)價(jià)值鏈中的一環(huán),而非全部,。
關(guān)于DeepSeek的突破,,林達(dá)華指出,DeepSeek有兩個(gè)近期的版本:V3基礎(chǔ)模型和R1推理模型,。V3的核心亮點(diǎn)在于模型和系統(tǒng)垂直整合后的訓(xùn)練效率優(yōu)化,;而R1則是構(gòu)建強(qiáng)推理能力的新算法路徑。V3整體表現(xiàn)優(yōu)秀,,綜合能力強(qiáng),,且在多項(xiàng)評測中表現(xiàn)突出,。這主要?dú)w功于數(shù)據(jù)的多樣性和高質(zhì)量處理以及高效的訓(xùn)練方法,。R1則采用了MoE架構(gòu),并通過負(fù)載均衡策略提升了訓(xùn)練效率。此外,,R1選擇了基于結(jié)果監(jiān)督的強(qiáng)化學(xué)習(xí)路線,,這一路徑在內(nèi)外部交叉驗(yàn)證中證明了其有效性。
對于DeepSeek的高效訓(xùn)練是否會(huì)顯著降低市場對算力的需求,,林達(dá)華表示,,算力需求不會(huì)下降。盡管單次訓(xùn)練成本得到了優(yōu)化,,但市場競爭白熱化,,效率的優(yōu)化會(huì)加快迭代,總體需求不會(huì)減少,。隨著DeepSeek推理能力的突破,,下游應(yīng)用市場快速擴(kuò)展,推理市場呈現(xiàn)供不應(yīng)求,、快速增長的態(tài)勢,。
談到大模型未來的演進(jìn)路徑,林達(dá)華認(rèn)為,,當(dāng)前大多數(shù)講述的是語言模型的故事,,但在真實(shí)業(yè)務(wù)場景中,AI需要處理的信息遠(yuǎn)不止于語言,,而是多模態(tài)數(shù)據(jù)的融合,。多模態(tài)仍然是AI發(fā)展的必然方向,未來AI將從語言模型演進(jìn)為推理模型,,最終發(fā)展為世界模型,。具備完整決策與執(zhí)行能力的AI智能體將是下一步的關(guān)鍵方向,以更高效,、更智能的方式驅(qū)動(dòng)業(yè)務(wù)的發(fā)展與創(chuàng)新,。
多模態(tài)模型的技術(shù)門檻較高,不僅僅是語言模型的簡單擴(kuò)展,。真正的多模態(tài)模型需要具備記憶能力,,涉及對LLM技術(shù)架構(gòu)的徹底重構(gòu)。目前業(yè)內(nèi)普遍討論的問題是未來1-2年內(nèi)互聯(lián)網(wǎng)的純語料數(shù)據(jù)將被消耗殆盡,,但海量的視覺數(shù)據(jù)仍然存在,。商湯堅(jiān)定地認(rèn)為,多模態(tài)大模型是核心發(fā)展方向,,設(shè)定了明確的技術(shù)目標(biāo),,包括強(qiáng)交互能力、強(qiáng)推理能力和長期記憶能力,。
最后,,關(guān)于大模型是否能賺錢以及開源是否會(huì)顛覆閉源,,林達(dá)華認(rèn)為開源在近年來大模型的發(fā)展中對產(chǎn)業(yè)格局產(chǎn)生了深遠(yuǎn)影響。開源不僅改變了全球AI和大模型的產(chǎn)業(yè)格局,,還加速了技術(shù)的傳播和普及,。真正的競爭優(yōu)勢體現(xiàn)在與基礎(chǔ)設(shè)施的深度整合和在特定行業(yè)的縱深發(fā)展。未來,,大模型應(yīng)用將從淺層工具轉(zhuǎn)向替代行業(yè)中高價(jià)值的核心任務(wù),。開源只是技術(shù)價(jià)值鏈中的一環(huán),而非全部,。
最近,,DeepSeek在國內(nèi)外引起廣泛關(guān)注,,其創(chuàng)始人梁文鋒也成為了焦點(diǎn)人物。梁文鋒來自廣東省湛江市吳川市,,今年春節(jié)他回到了老家過年
2025-01-31 08:17:17DeepSeek創(chuàng)始人家鄉(xiāng)拉橫幅歡迎游客