李想:L2級輔助駕駛不算生產(chǎn)工具 未來VLA將成專業(yè)司機(jī),!5月7日晚,,理想汽車推出了“理想AI Talk第二季——理想VLA司機(jī)大模型,從動物進(jìn)化到人類”,。理想汽車創(chuàng)始人,、CEO李想分享了對人工智能的最新思考,包括VLA司機(jī)大模型的作用,、訓(xùn)練方法和挑戰(zhàn),,以及對創(chuàng)業(yè)和個人成長的見解。
李想將當(dāng)前熱門的AI工具分為三個層級:信息工具,、輔助工具和生產(chǎn)工具,。他指出,目前大多數(shù)人將AI作為信息工具使用,,但這些工具常伴隨大量無效信息,,僅具參考價(jià)值。成為輔助工具后,,AI可以提升效率,,例如現(xiàn)在的輔助駕駛,但仍需人類參與,。未來,,AI發(fā)展為生產(chǎn)工具后,將能獨(dú)立完成專業(yè)任務(wù),,顯著提升效率與質(zhì)量,。李想認(rèn)為,判斷AI是否真正智能的關(guān)鍵在于它是否成為生產(chǎn)工具,。只有當(dāng)人工智能變成生產(chǎn)工具,,才是其真正爆發(fā)的時(shí)刻。
面對AI的發(fā)展,,李想強(qiáng)調(diào)所有的人性都應(yīng)被保留,,無論好壞,因?yàn)橐磺腥诵远际俏幕?、生命,、性格,、能力的特質(zhì),,也是人類真正的生命力所在,。對于智能輔助駕駛,李想直言如今的L2,、L2+組合駕駛輔助仍屬于輔助工具階段,,而VLA(視覺語言行動模型)能夠讓AI真正成為司機(jī),成為交通領(lǐng)域的專業(yè)生產(chǎn)工具,。未來的VLA就像人類司機(jī)一樣工作,。
VLA的實(shí)現(xiàn)經(jīng)歷了三個階段。第一階段,,理想汽車自2021年起自研依賴規(guī)則算法和高精地圖的輔助駕駛,,類似“昆蟲動物智能”。第二階段,,理想汽車自2023年起研究并于2024年正式推送的端到端+VLM(視覺語言模型)輔助駕駛,,接近“哺乳動物智能”。第三階段,,VLA將開啟“人類智能”階段,,通過3D和2D視覺的組合,完整地看到物理世界,,并具備語言和CoT(思維鏈)推理能力,,既能看也能理解并執(zhí)行行動,符合人類運(yùn)作方式,。
VLA的訓(xùn)練分為預(yù)訓(xùn)練,、后訓(xùn)練和強(qiáng)化訓(xùn)練三個環(huán)節(jié)。預(yù)訓(xùn)練相當(dāng)于學(xué)習(xí)物理世界和交通領(lǐng)域的常識,,通過大量高清2D和3D視覺數(shù)據(jù),、交通相關(guān)的語言語料,以及與物理世界相關(guān)的視覺和語言聯(lián)合數(shù)據(jù),,訓(xùn)練出云端的VL基座模型,,并轉(zhuǎn)化為在車端高效運(yùn)行的端側(cè)模型。后訓(xùn)練類似于去駕校學(xué)開車,,加入動作數(shù)據(jù)后,,VL基座變?yōu)閂LA司機(jī)大模型,具備實(shí)時(shí)性和復(fù)雜交通環(huán)境中的博弈能力,。強(qiáng)化訓(xùn)練類似于實(shí)際開車練習(xí),,目標(biāo)是讓VLA更安全、舒適,,對齊人類價(jià)值觀,,甚至超越人類駕駛水平,。經(jīng)過預(yù)訓(xùn)練、后訓(xùn)練和強(qiáng)化訓(xùn)練后,,VLA即可部署至車端運(yùn)行,。
VLA以“司機(jī)Agent”的產(chǎn)品形態(tài)呈現(xiàn),用戶可通過自然語言與司機(jī)Agent溝通,。簡單通用的短指令由端側(cè)的VLA直接處理,,復(fù)雜指令則先由云端的VL基座模型解析,再交由VLA處理,。為了保障VLA的安全和舒適,,理想汽車在強(qiáng)化訓(xùn)練環(huán)節(jié)投入大量資源,并于2024年底組建超過100人的超級對齊團(tuán)隊(duì),,注入職業(yè)素養(yǎng),。此外,理想汽車結(jié)合重建和生成兩種路徑,,打造了真實(shí),、符合物理世界規(guī)律的世界模型,提升解決問題的效率,,有效應(yīng)對模型黑盒帶來的挑戰(zhàn),。
判斷司機(jī)Agent是否是個好司機(jī)有三個關(guān)鍵標(biāo)準(zhǔn):專業(yè)能力,、職業(yè)能力和構(gòu)建信任的能力,。VLA提升了專業(yè)能力,超級對齊增強(qiáng)了職業(yè)能力,,VLA通過理解自然語言和具備記憶能力提升了構(gòu)建信任的能力,。理想汽車依托自有編譯團(tuán)隊(duì),,自研底層推理引擎,使芯片可通過INT4量化的方式運(yùn)行VLM,。憑借綜合能力,,理想汽車實(shí)現(xiàn)了讓雙Orin-X芯片和Thor-U芯片運(yùn)行同等規(guī)模的VLA司機(jī)大模型。
李想還提到,,得益于DeepSeek的開源,,理想汽車在VLA司機(jī)大模型的語言能力研發(fā)上提速顯著,節(jié)省了近9個月的時(shí)間和數(shù)億元成本,。今年7月,,理想汽車將迎來成立十周年。李想表示,,創(chuàng)業(yè)路上苦多于甜,,他選擇保留有價(jià)值的美好片段來激勵自己保持正能量。回顧幾次創(chuàng)業(yè)經(jīng)歷,,李想表示思維方式?jīng)]有變化,,遇到問題解決問題,解決用戶的痛點(diǎn),,不斷向他人學(xué)習(xí),。不同的是,如今面臨的問題更復(fù)雜,、服務(wù)的用戶群體更多,、公司規(guī)模和組織也更龐大。
12月25日,理想汽車官方發(fā)布了一段2024理想AI Talk的預(yù)覽視頻,,并配文詢問李想為何不再專注于造車,,而是轉(zhuǎn)向人工智能企業(yè)
2024-12-26 09:37:59李想宣布要做人工智能企業(yè)