李想提到,,規(guī)則算法和端到端架構(gòu)存在兩個主要問題:一是難以處理復(fù)雜場景,二是無法與人溝通。相比之下,VLA架構(gòu)能夠更好地理解復(fù)雜場景并通過生成數(shù)據(jù)進(jìn)行訓(xùn)練。此外,,它還能通過語言理解指令,從而更靈活地執(zhí)行任務(wù)。例如,,在小區(qū)等開放空間中,司機(jī)大模型可以與導(dǎo)航系統(tǒng)配合,,完成復(fù)雜的駕駛?cè)蝿?wù),。
VLA架構(gòu)的訓(xùn)練分為四個步驟。首先,,訓(xùn)練一個VL(視覺和語言)基座模型,,該模型包含大量3D和2D視覺語料以及交通相關(guān)的語言資料。其次,,將行動部分加入模型,,使其從VL模型變?yōu)閂LA模型。第三步是強(qiáng)化訓(xùn)練,,包括基于人類反饋的強(qiáng)化學(xué)習(xí)和純粹的強(qiáng)化學(xué)習(xí),。最后一步是構(gòu)建一個能夠理解司機(jī)語音指令的Agent。
李想表示,,VLA架構(gòu)最早可能在交通領(lǐng)域得到廣泛應(yīng)用,,因?yàn)榻煌ㄒ?guī)則明確且具有確定性。盡管VLA架構(gòu)目前是能力最強(qiáng)的,,但不一定是最高效的,。未來可能會出現(xiàn)更高效的新架構(gòu)。面對當(dāng)前社會對輔助駕駛的負(fù)面評價,,李想認(rèn)為這類似于黎明前的黑暗,,光明即將到來。
3月27日,2025中關(guān)村論壇年會開幕,會上發(fā)布了重大科技成果,,其中理想汽車自研的整車操作系統(tǒng)“理想星環(huán)OS”入選北京重大開源系列成果
2025-03-27 13:45:32理想開源汽車操作系統(tǒng)