李想：L2級輔助駕駛不算生產(chǎn)工具未來VLA將成專業(yè)司機(jī)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-05-08 13:34:22 網(wǎng)易

李想：L2級輔助駕駛不算生產(chǎn)工具未來VLA將成專業(yè)司機(jī),！5月7日晚,，理想汽車推出了“理想AI Talk第二季——理想VLA司機(jī)大模型，從動物進(jìn)化到人類”,。理想汽車創(chuàng)始人,、CEO李想分享了對人工智能的最新思考，包括VLA司機(jī)大模型的作用,、訓(xùn)練方法和挑戰(zhàn),，以及對創(chuàng)業(yè)和個人成長的見解。

李想將當(dāng)前熱門的AI工具分為三個層級：信息工具,、輔助工具和生產(chǎn)工具,。他指出，目前大多數(shù)人將AI作為信息工具使用,，但這些工具常伴隨大量無效信息,，僅具參考價(jià)值。成為輔助工具后,，AI可以提升效率,，例如現(xiàn)在的輔助駕駛，但仍需人類參與,。未來,，AI發(fā)展為生產(chǎn)工具后，將能獨(dú)立完成專業(yè)任務(wù),，顯著提升效率與質(zhì)量,。李想認(rèn)為，判斷AI是否真正智能的關(guān)鍵在于它是否成為生產(chǎn)工具,。只有當(dāng)人工智能變成生產(chǎn)工具,，才是其真正爆發(fā)的時(shí)刻。

面對AI的發(fā)展,，李想強(qiáng)調(diào)所有的人性都應(yīng)被保留,，無論好壞，因?yàn)橐磺腥诵远际俏幕?、生命,、性格,、能力的特質(zhì),，也是人類真正的生命力所在,。對于智能輔助駕駛，李想直言如今的L2,、L2+組合駕駛輔助仍屬于輔助工具階段,，而VLA（視覺語言行動模型）能夠讓AI真正成為司機(jī)，成為交通領(lǐng)域的專業(yè)生產(chǎn)工具,。未來的VLA就像人類司機(jī)一樣工作,。

VLA的實(shí)現(xiàn)經(jīng)歷了三個階段。第一階段,，理想汽車自2021年起自研依賴規(guī)則算法和高精地圖的輔助駕駛,，類似“昆蟲動物智能”。第二階段,，理想汽車自2023年起研究并于2024年正式推送的端到端+VLM（視覺語言模型）輔助駕駛,，接近“哺乳動物智能”。第三階段,，VLA將開啟“人類智能”階段,，通過3D和2D視覺的組合，完整地看到物理世界,，并具備語言和CoT（思維鏈）推理能力,，既能看也能理解并執(zhí)行行動，符合人類運(yùn)作方式,。

VLA的訓(xùn)練分為預(yù)訓(xùn)練,、后訓(xùn)練和強(qiáng)化訓(xùn)練三個環(huán)節(jié)。預(yù)訓(xùn)練相當(dāng)于學(xué)習(xí)物理世界和交通領(lǐng)域的常識,，通過大量高清2D和3D視覺數(shù)據(jù),、交通相關(guān)的語言語料，以及與物理世界相關(guān)的視覺和語言聯(lián)合數(shù)據(jù),，訓(xùn)練出云端的VL基座模型,，并轉(zhuǎn)化為在車端高效運(yùn)行的端側(cè)模型。后訓(xùn)練類似于去駕校學(xué)開車,，加入動作數(shù)據(jù)后,，VL基座變?yōu)閂LA司機(jī)大模型，具備實(shí)時(shí)性和復(fù)雜交通環(huán)境中的博弈能力,。強(qiáng)化訓(xùn)練類似于實(shí)際開車練習(xí),，目標(biāo)是讓VLA更安全、舒適,，對齊人類價(jià)值觀,，甚至超越人類駕駛水平,。經(jīng)過預(yù)訓(xùn)練、后訓(xùn)練和強(qiáng)化訓(xùn)練后,，VLA即可部署至車端運(yùn)行,。

VLA以“司機(jī)Agent”的產(chǎn)品形態(tài)呈現(xiàn)，用戶可通過自然語言與司機(jī)Agent溝通,。簡單通用的短指令由端側(cè)的VLA直接處理,，復(fù)雜指令則先由云端的VL基座模型解析，再交由VLA處理,。為了保障VLA的安全和舒適,，理想汽車在強(qiáng)化訓(xùn)練環(huán)節(jié)投入大量資源，并于2024年底組建超過100人的超級對齊團(tuán)隊(duì),，注入職業(yè)素養(yǎng),。此外，理想汽車結(jié)合重建和生成兩種路徑,，打造了真實(shí),、符合物理世界規(guī)律的世界模型，提升解決問題的效率,，有效應(yīng)對模型黑盒帶來的挑戰(zhàn),。

判斷司機(jī)Agent是否是個好司機(jī)有三個關(guān)鍵標(biāo)準(zhǔn)：專業(yè)能力,、職業(yè)能力和構(gòu)建信任的能力,。VLA提升了專業(yè)能力，超級對齊增強(qiáng)了職業(yè)能力,，VLA通過理解自然語言和具備記憶能力提升了構(gòu)建信任的能力,。理想汽車依托自有編譯團(tuán)隊(duì),，自研底層推理引擎，使芯片可通過INT4量化的方式運(yùn)行VLM,。憑借綜合能力,，理想汽車實(shí)現(xiàn)了讓雙Orin-X芯片和Thor-U芯片運(yùn)行同等規(guī)模的VLA司機(jī)大模型。

李想還提到,，得益于DeepSeek的開源,，理想汽車在VLA司機(jī)大模型的語言能力研發(fā)上提速顯著，節(jié)省了近9個月的時(shí)間和數(shù)億元成本,。今年7月,，理想汽車將迎來成立十周年。李想表示,，創(chuàng)業(yè)路上苦多于甜,，他選擇保留有價(jià)值的美好片段來激勵自己保持正能量。回顧幾次創(chuàng)業(yè)經(jīng)歷,，李想表示思維方式?jīng)]有變化,，遇到問題解決問題，解決用戶的痛點(diǎn),，不斷向他人學(xué)習(xí),。不同的是，如今面臨的問題更復(fù)雜,、服務(wù)的用戶群體更多,、公司規(guī)模和組織也更龐大。

(責(zé)任編輯：0882)

關(guān)閉

李想：L2級輔助駕駛不算生產(chǎn)工具 未來VLA將成專業(yè)司機(jī)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

李想：L2級輔助駕駛不算生產(chǎn)工具未來VLA將成專業(yè)司機(jī)