對于駕駛而言,感知交通環(huán)境信息越全面,、越及時,,駕駛的安全性也就相對越高。因此,,自動駕駛系統(tǒng)對感知能力的需求是沒有上限的,。
BEV網(wǎng)絡(luò)固然可以檢測白名單障礙物,但能檢測到1000多種物體基本上就是目前BEV網(wǎng)絡(luò)的感知上限,。OCC占用網(wǎng)絡(luò)可以檢測通用障礙物,,但OCC算法的運(yùn)算量跟隨網(wǎng)格的大小成倍變化,網(wǎng)格大小縮減一倍,,OCC算法的運(yùn)算量將增加8倍,,受限于算力和實(shí)時性,OCC網(wǎng)格的大小一般只能做到10厘米左右,,這就意味著它很難檢測微小物體,。在很多情況下,,10公分大的物體足以造成交通事故了,。
不僅如此,那些和駕駛安全,、效率,、舒適性密切相關(guān)的天氣、光照,、雨霧等復(fù)雜語義,,也是目前的BEV+OCC所解決不了的,而光照和天氣恰恰是可以影響自動駕駛車輛行駛的關(guān)鍵要素,。
數(shù)據(jù)正在成為端到端最大瓶頸
相較于分模塊的自動駕駛方案,,端到端方案主要解決了兩個問題。首先,,從人工邏輯代碼到數(shù)據(jù)驅(qū)動,,人工智能真正擺脫了“人工”,從此可以使用海量的數(shù)據(jù)迭代模型的性能,;其次,,通過自動抽取信息,減少信息損失,,可以充分利用數(shù)據(jù)中的信息,。
在過去幾年的時間里,隨著Transformer+BEV+OCC的問世,,分立級聯(lián)的感知模塊已經(jīng)慢慢完成了到端到端感知的切換,,自2023年下半年以來這波端到端狂潮引發(fā)的“從人工邏輯代碼到數(shù)據(jù)驅(qū)動”的轉(zhuǎn)變,,其實(shí)主要體現(xiàn)在決策和規(guī)劃層面。
決策和規(guī)劃從一板一眼的手工編寫規(guī)則進(jìn)化到基于神經(jīng)網(wǎng)絡(luò)的經(jīng)驗(yàn)直覺,,這種AI化和端到端化使得可以通過海量數(shù)據(jù)不間斷訓(xùn)練優(yōu)化駕駛策略,,復(fù)現(xiàn)擬人且絲滑的老司機(jī)腳法。決策和規(guī)劃的進(jìn)步是巨大的,,相比之下,,感知能力的進(jìn)步并不大。