理想汽車的“無(wú)人區(qū)”豪賭 押注VLA技術(shù)!理想汽車去年年底,李想宣布將全力投入AI領(lǐng)域,。當(dāng)時(shí),關(guān)于Mind GPT的對(duì)話能力,、L3自動(dòng)駕駛路線圖以及“硅基家人”的構(gòu)想聽起來(lái)更像一場(chǎng)宏大敘事的開場(chǎng)白,具體技術(shù)路徑尚不明朗,。
時(shí)隔130天,,李想再次面向公眾詳細(xì)講解了VLA(視覺(jué)-語(yǔ)言-行為模型)的技術(shù)細(xì)節(jié),使理想的AI戰(zhàn)略輪廓逐漸清晰。VLA的概念并非首次出現(xiàn),,早在2023年7月,,谷歌DeepMind就推出了全球首個(gè)控制機(jī)器人的VLA模型。如今這一模型概念正快速擴(kuò)散到智駕領(lǐng)域,。今年3月份在英偉達(dá)GTC大會(huì)上,,理想首次發(fā)布了自己的VLA架構(gòu)。
李想表示,,目前VLA是否是最高效的方式仍不確定,,但至少現(xiàn)階段它是最強(qiáng)架構(gòu),能夠接近甚至超越人類的能力,。他直言押注VLA技術(shù)是一個(gè)“無(wú)人區(qū)”戰(zhàn)略,,因?yàn)镈eepseek、OpenAI,、谷歌和Waymo都沒(méi)有走過(guò)這條路,。
這種對(duì)VLA的執(zhí)著本質(zhì)上是理想汽車在行業(yè)劇變中尋求生存與突破的選擇。盡管2024年理想汽車以50萬(wàn)輛交付量問(wèn)鼎新勢(shì)力銷冠,,但凈利潤(rùn)同比下滑31.9%暴露出發(fā)展隱憂,。價(jià)格策略上的矛盾尤為明顯:雖然李想曾質(zhì)疑“降價(jià)提升銷量”的常規(guī)路徑,但面對(duì)市場(chǎng)競(jìng)爭(zhēng)壓力,,一方面去年4月采取降價(jià)策略,,另一方面讓理想L6以25萬(wàn)元以下的定價(jià)搶占市場(chǎng)。
這種“以價(jià)換量”的策略雖拉動(dòng)銷量增長(zhǎng),,卻導(dǎo)致單車?yán)麧?rùn)顯著低于高端L系列,,整體盈利水平被稀釋。數(shù)據(jù)顯示,,其單車毛利率從21.5%下滑至19.8%,,直接拖累凈利潤(rùn)表現(xiàn)。此外,,首款純電車型MEGA的失利暴露出技術(shù)斷檔風(fēng)險(xiǎn)——既未建立純電技術(shù)護(hù)城河,,又面臨增程用戶向純電遷移的轉(zhuǎn)化困境,2025年5萬(wàn)輛純電目標(biāo)遠(yuǎn)低于比亞迪,、特斯拉的布局速度,。增程式用戶與純電用戶需求的重疊度低,也可能會(huì)導(dǎo)致理想在技術(shù)路線切換中面臨“左右互搏”的困境,。
更為致命的是,競(jìng)品們正以更激進(jìn)的技術(shù)路徑蠶食其核心戰(zhàn)場(chǎng),。華為問(wèn)界M8/M9增程版,、零跑C系列等車型的推出,使增程式市場(chǎng)從“藍(lán)?!鞭D(zhuǎn)向“紅?!?。理想L系列依賴的“冰箱彩電大沙發(fā)”差異化配置逐漸被效仿,產(chǎn)品溢價(jià)能力下降,。2025年競(jìng)爭(zhēng)更加激烈,,小鵬汽車將于下半年推出增程車型,蔚來(lái)旗下樂(lè)道品牌兩款新車直指理想L7/L8,,華為賦能的智界R7增程版也擠進(jìn)了戰(zhàn)場(chǎng),。增程市場(chǎng)的邊際收益衰退已成定局。
這些問(wèn)題的本質(zhì)是企業(yè)戰(zhàn)略換軌的陣痛,。從增程市場(chǎng)機(jī)會(huì)主義者向智能電動(dòng)長(zhǎng)期主義者轉(zhuǎn)型,,理想正支付技術(shù)路線切換的沉沒(méi)成本。短期看,,價(jià)格戰(zhàn)壓力與純電滯后的矛盾仍將延續(xù),;長(zhǎng)期而言,VLA模型與AI生態(tài)的協(xié)同效應(yīng)或是破局關(guān)鍵,。若能借技術(shù)代差重構(gòu)競(jìng)爭(zhēng)維度,,在智能化體驗(yàn)與工程落地間找到平衡點(diǎn),或可打開第二增長(zhǎng)曲線,,否則或?qū)⑾萑搿耙?guī)模陷阱”,,在銷量增長(zhǎng)與利潤(rùn)萎縮的剪刀差中喪失主動(dòng)權(quán)。
在這樣的背景下,,李想布局VLA這條“無(wú)人區(qū)”技術(shù)路線的深層動(dòng)因不難理解——試圖通過(guò)技術(shù)破局重構(gòu)競(jìng)爭(zhēng)維度?,F(xiàn)階段,智駕市場(chǎng)競(jìng)爭(zhēng)焦點(diǎn)已從單純的功能實(shí)現(xiàn)轉(zhuǎn)向了更深層次的技術(shù)范式競(jìng)爭(zhēng),。智能駕駛技術(shù)的發(fā)展歷程顯示,,技術(shù)路線始終處于不斷迭代中。從卷積神經(jīng)網(wǎng)絡(luò)(CNN)的引入,,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的應(yīng)用,,到結(jié)合鳥瞰圖(BEV)與Transformer(自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu))的創(chuàng)新,再到端到端,。
眼下,,智能駕駛又來(lái)到新的十字路口——VLA。這種架構(gòu)創(chuàng)新打破了傳統(tǒng)自動(dòng)駕駛系統(tǒng)“感知-規(guī)劃-控制”的線性邏輯,,轉(zhuǎn)而模擬人類司機(jī)的思維模式:看見(jiàn)三維世界(3D/2D視覺(jué)融合),、理解交通語(yǔ)義(語(yǔ)言模型解析)、推演行動(dòng)路徑(思維鏈決策),。李想解釋說(shuō),,VLA是一個(gè)司機(jī)大模型,像人類的司機(jī)一樣去工作的一個(gè)模型。通俗理解,,有VLA賦能的車不再只是一個(gè)駕駛工具,,而是一個(gè)能與用戶溝通、理解用戶意圖的智能體,,能夠聽得懂,、看得見(jiàn)、找得到,,一個(gè)真正意義上的司機(jī)Agent,。
不過(guò),VLA的實(shí)現(xiàn)也不是一個(gè)突變的過(guò)程,。在李想的技術(shù)演進(jìn)框架中,,AI智能被劃分為昆蟲動(dòng)物智能、哺乳動(dòng)物智能和人類智能三個(gè)階段,。第一階段,,理想汽車自2021年起自研依賴規(guī)則算法和高精地圖的輔助駕駛,類似“昆蟲動(dòng)物智能”,。第二階段,,接近“哺乳動(dòng)物智能”。理想汽車自2023年起研究,,并于2024年正式推送的端到端+VLM(視覺(jué)語(yǔ)言模型)輔助駕駛,,此階段通過(guò)三維圖像判斷自身速度和軌跡以及在空間中所處的位置,足以應(yīng)對(duì)大部分泛化場(chǎng)景,,但很難解決從未遇到過(guò)或特別復(fù)雜的問(wèn)題,,需要配合視覺(jué)語(yǔ)言VLM模型,但現(xiàn)有視覺(jué)語(yǔ)言模型在應(yīng)對(duì)復(fù)雜交通環(huán)境時(shí)只能起到輔助作用,。
在端到端的基礎(chǔ)上,,到第三階段,VLA將開啟“人類智能”的階段——能通過(guò)3D和2D視覺(jué)的組合,,完整地看到物理世界,,而不像VLM僅能解析2D圖像。同時(shí),,VLA擁有完整的腦系統(tǒng),,不僅能看見(jiàn)物理世界,更能進(jìn)一步理解物理世界,,具有自己的語(yǔ)言和思維鏈系統(tǒng),,有推理能力,可以像人類一樣執(zhí)行一些復(fù)雜動(dòng)作,?!爸挥凶屗兂梢粋€(gè)真正的司機(jī),,它才是一個(gè)生產(chǎn)力工具,不只是一個(gè)輔助工具,。”李想將AI工具分為信息工具,、輔助工具和生產(chǎn)工具,,在他看來(lái),現(xiàn)階段人們大多還是把AI當(dāng)作一個(gè)信息工具來(lái)用,,這是不完美的,。L2,L2+也只是把AI當(dāng)成輔助工具在用,,只有當(dāng)AI成為生產(chǎn)工具時(shí),,人工智能才會(huì)真正爆發(fā)。
隨著AI能力躍升,,行業(yè)也迎來(lái)關(guān)于“安全性”的拷問(wèn),。最近智能駕駛技術(shù)安全性被質(zhì)疑,整個(gè)行業(yè)被推至輿論風(fēng)口浪尖,,行業(yè)普遍面臨“能力提升悖論”:隨著自動(dòng)駕駛能力的提升,,其上限高,下限低的弊端也隨之暴露,。超級(jí)對(duì)齊的目標(biāo)就是通過(guò)設(shè)計(jì)有效且高效的對(duì)齊算法,,確保這些超人類智能系統(tǒng)仍然安全、可靠并與人類價(jià)值觀保持一致,。例如在彎道限速60時(shí),,其他車輛保持60kph,而自車保持30kph,,此時(shí)自車就成了最危險(xiǎn)的車輛,,因此為了保證安全性,需要與其他車輛進(jìn)行速度對(duì)齊,,以60kph的速度行駛,,更符合法規(guī)常識(shí)。
對(duì)此,,理想汽車選擇雙線突破:在技術(shù)端,,在強(qiáng)化訓(xùn)練環(huán)節(jié)理想汽車投入大量資源,并于2024年底組建超過(guò)100人的超級(jí)對(duì)齊團(tuán)隊(duì),;在系統(tǒng)端,,理想還搭建了安全對(duì)齊的監(jiān)控系統(tǒng),借此確認(rèn)安全對(duì)齊的動(dòng)作是否有效,,同時(shí)也能發(fā)現(xiàn)未覆蓋到的動(dòng)作,,并通過(guò)云端系統(tǒng)來(lái)觀察現(xiàn)有規(guī)則是否幫助到用戶,,進(jìn)而確認(rèn)有哪些場(chǎng)景需要納入安全對(duì)齊,實(shí)現(xiàn)閉環(huán),。
李想給出了判斷司機(jī)Agent是不是個(gè)好司機(jī)的三個(gè)關(guān)鍵標(biāo)準(zhǔn):專業(yè)能力,、職業(yè)能力和構(gòu)建信任的能力。此次AI Talk最深刻的隱喻,,是理想汽車身份的重構(gòu),。當(dāng)李想已經(jīng)宣布“我們不是汽車公司,而是人工智能企業(yè)”時(shí),,其目標(biāo)已不止于銷量競(jìng)爭(zhēng),,而是爭(zhēng)奪智能汽車時(shí)代的定義權(quán)。這種野心的底氣一部分源自VLA的泛化能力——該模型不僅用于自動(dòng)駕駛,,還可賦能家庭機(jī)器人,、工業(yè)設(shè)備等多元場(chǎng)景。
然而,,這場(chǎng)豪賭的風(fēng)險(xiǎn)同樣清晰可見(jiàn):元戎啟行,、吉利汽車都已布局,行業(yè)正展開“軍備競(jìng)賽”,,加之用戶對(duì)AI倫理的信任危機(jī),,都在考驗(yàn)理想的工程化能力。但至少在此刻,,李想用一場(chǎng)充滿技術(shù)密度的直播證明:理想已突破傳統(tǒng)車企的思維窠臼,,在競(jìng)爭(zhēng)的戰(zhàn)場(chǎng)上率先樹立起技術(shù)坐標(biāo)。