近年來,自動(dòng)駕駛技術(shù)不斷演進(jìn),從最初的輔助駕駛到如今的高階智駕,技術(shù)路線和系統(tǒng)架構(gòu)也不斷發(fā)生著變化。在自動(dòng)駕駛系統(tǒng)中,決策規(guī)劃模塊承擔(dān)著“思考”的作用,作為自動(dòng)駕駛汽車的“大腦”,它直接影響汽車在真實(shí)道路環(huán)境中的安全性和魯棒性。
在自動(dòng)駕駛系統(tǒng)開發(fā)初期,很多車企都選擇依托基于規(guī)則的決策方案,通過提前定義好的行駛規(guī)則、邏輯判斷和專家經(jīng)驗(yàn),對各種交通場景進(jìn)行應(yīng)急響應(yīng)和規(guī)劃。這種方法因其明確可解釋、經(jīng)過大量工程驗(yàn)證而獲得了廣泛應(yīng)用。這一方法看似非常合理,但在面對邊緣場景時(shí),其處理表現(xiàn)往往不盡如人意。
隨著深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和大數(shù)據(jù)技術(shù)的迅速發(fā)展,端到端大模型方案開始在自動(dòng)駕駛領(lǐng)域嶄露頭角。這類方案通過大規(guī)模數(shù)據(jù)訓(xùn)練,從傳感器輸入直接映射到車輛控制命令,在理論上能夠捕捉到傳統(tǒng)規(guī)則難以覆蓋的復(fù)雜情況。在端到端發(fā)展的同時(shí),我們不禁會(huì)思考:在擁有端到端大模型方案的同時(shí),是否還需要繼續(xù)發(fā)展基于規(guī)則的方案?
端到端有何優(yōu)劣?
從技術(shù)實(shí)現(xiàn)角度來看,端到端大模型方案的優(yōu)勢在于其數(shù)據(jù)驅(qū)動(dòng)的本質(zhì)。利用深度神經(jīng)網(wǎng)絡(luò),不論是卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)還是近年來備受關(guān)注的Transformer架構(gòu),都可以從原始傳感器數(shù)據(jù)中自動(dòng)提取特征,并構(gòu)建復(fù)雜的決策映射。模型訓(xùn)練過程中,不僅能夠利用大量的實(shí)際道路數(shù)據(jù),還可以通過仿真和增強(qiáng)學(xué)習(xí)補(bǔ)充少見場景,從而使得模型具備更好的泛化能力。大模型通過端到端學(xué)習(xí),理論上能將感知、規(guī)劃、控制等多個(gè)環(huán)節(jié)緊密結(jié)合,減少了中間轉(zhuǎn)換過程中引入的誤差積累,這對于解決高速行駛時(shí)的瞬間決策具有很大優(yōu)勢。尤其在面對那些難以提前枚舉的復(fù)雜交通場景時(shí),數(shù)據(jù)驅(qū)動(dòng)的方法有望發(fā)現(xiàn)隱含的規(guī)律,提供更為靈活和細(xì)致的響應(yīng)。
端到端方案的“黑盒”特性一直是業(yè)內(nèi)討論的焦點(diǎn)。由于深度神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)極其復(fù)雜,其決策過程往往缺乏足夠的可解釋性,這無疑會(huì)引發(fā)一系列驗(yàn)證和監(jiān)管問題。特別是在極端情況下或面對罕見場景時(shí),模型輸出往往難以用直觀的邏輯進(jìn)行解釋。為了解決這一問題,研究人員嘗試引入注意力機(jī)制、后驗(yàn)分析和混合驗(yàn)證技術(shù),力圖揭示神經(jīng)網(wǎng)絡(luò)內(nèi)部部分激活對應(yīng)的決策依據(jù)。但無論如何,這種解釋仍然無法達(dá)到傳統(tǒng)基于規(guī)則系統(tǒng)那種“邏輯明確、易于審計(jì)”的水平。
端到端模型的訓(xùn)練還依賴于大量數(shù)據(jù),而數(shù)據(jù)本身的采集、標(biāo)注和質(zhì)量控制也存在巨大挑戰(zhàn)。實(shí)際道路數(shù)據(jù)中,常見場景占據(jù)了絕大多數(shù),但一些極端事件和異常情況的數(shù)據(jù)十分稀缺,這使得模型在應(yīng)對這些少見情況時(shí)可能表現(xiàn)欠佳。數(shù)據(jù)不平衡和標(biāo)簽噪聲問題直接關(guān)系到模型的魯棒性與可靠性,這也是自動(dòng)駕駛系統(tǒng)必須嚴(yán)格考慮的問題。
基于規(guī)則的決策有何優(yōu)劣?
基于規(guī)則的決策系統(tǒng)在自動(dòng)駕駛的早期研發(fā)中被廣泛應(yīng)用,其最大的優(yōu)點(diǎn)在于可解釋性和安全性。通過提前設(shè)計(jì)好每種交通情境下應(yīng)采取的措施,確保在已知場景中始終執(zhí)行預(yù)設(shè)的安全策略。通過給決策系統(tǒng)提供駕駛員實(shí)踐中積累的豐富的交通規(guī)則、行駛邏輯和安全冗余設(shè)計(jì),使決策系統(tǒng)在面對多數(shù)常規(guī)情況時(shí)可以有穩(wěn)定的表現(xiàn)。當(dāng)遇到突發(fā)情況或傳感器數(shù)據(jù)異常時(shí),基于規(guī)則的系統(tǒng)也可以作為“最后一道防線”,提供較為明確的安全響應(yīng),但在遇到特殊的邊緣場景時(shí),其靈活性仍有不足,但其確定性和驗(yàn)證容易性卻遠(yuǎn)超端到端模型。
是否要絕對站隊(duì)?
端到端和基于規(guī)則,是否一定要站隊(duì)?其實(shí)現(xiàn)階段,端到端的方案并未成熟,依舊有很多的技術(shù)難題需要解決,現(xiàn)在越來越多的研究和開發(fā)團(tuán)隊(duì)正探索如何將兩種方案進(jìn)行有機(jī)融合。端到端大模型方案在高層次上進(jìn)行環(huán)境理解和初步?jīng)Q策,同時(shí)在低層次的控制和關(guān)鍵安全環(huán)節(jié)中嵌入基于規(guī)則的約束。這樣的分層設(shè)計(jì)既能夠發(fā)揮數(shù)據(jù)驅(qū)動(dòng)方法對復(fù)雜場景的適應(yīng)優(yōu)勢,也能在面對未知情況時(shí)依靠預(yù)設(shè)規(guī)則確保系統(tǒng)的安全性。如在低速行駛、狹窄路段、復(fù)雜交叉口等關(guān)鍵場景下,可額外啟用規(guī)則模塊來監(jiān)控和調(diào)整端到端模型的輸出,確保決策結(jié)果不會(huì)超出預(yù)期范圍。
這種混合方案看似非常完美,但還需要考慮如何在不同模型之間實(shí)現(xiàn)融合、如何設(shè)計(jì)安全回退機(jī)制,以及如何在實(shí)時(shí)性和計(jì)算資源之間取得平衡。目前有技術(shù)提出通過軟硬件協(xié)同的方式來實(shí)現(xiàn)這一目標(biāo),如利用專用AI加速芯片和邊緣計(jì)算設(shè)備,實(shí)現(xiàn)大模型的高效推理,同時(shí)在關(guān)鍵安全模塊中采用低延遲的規(guī)則邏輯,二者協(xié)同工作,確保在毫秒級響應(yīng)下也能完成復(fù)雜決策計(jì)算。
筆者觀點(diǎn)
智駕最前沿以為,自動(dòng)駕駛技術(shù)始終是一項(xiàng)跨學(xué)科、跨領(lǐng)域的系統(tǒng)工程,其發(fā)展必然會(huì)經(jīng)歷多個(gè)技術(shù)方案不斷碰撞、融合和優(yōu)化的過程。在這一過程中,單一依靠數(shù)據(jù)驅(qū)動(dòng)或規(guī)則設(shè)計(jì)都難以滿足所有安全和性能要求。端到端大模型雖然在處理大規(guī)模、復(fù)雜數(shù)據(jù)方面具有明顯優(yōu)勢,但其“黑盒”特性和安全驗(yàn)證問題使得其在關(guān)鍵安全環(huán)節(jié)難以獨(dú)自擔(dān)當(dāng)重任。基于規(guī)則的方案在緊急狀態(tài)下能夠迅速觸發(fā)預(yù)設(shè)策略,避免潛在風(fēng)險(xiǎn),其明確的邏輯和低延遲的計(jì)算為系統(tǒng)提供了不可替代的安全保障。未來的自動(dòng)駕駛決策系統(tǒng)必然會(huì)采用一種混合架構(gòu),通過不同技術(shù)層次和模塊的協(xié)同運(yùn)作,實(shí)現(xiàn)系統(tǒng)整體性能的最優(yōu)化,通過技術(shù)的多樣性,彌補(bǔ)各自的短板,讓自動(dòng)駕駛汽車在面對不確定和復(fù)雜場景時(shí),可以提供一種全方位的安全保障。
自動(dòng)駕駛決策系統(tǒng)的設(shè)計(jì)不應(yīng)被單一技術(shù)方案所限制。數(shù)據(jù)驅(qū)動(dòng)的大模型和傳統(tǒng)的基于規(guī)則方法各自具備獨(dú)特優(yōu)勢,只有兩者的深度融合,才能在保證系統(tǒng)高效、實(shí)時(shí)響應(yīng)的同時(shí),提供足夠的安全冗余和可解釋性。正是這種互補(bǔ)性,讓自動(dòng)駕駛技術(shù)可以在復(fù)雜、多變的交通環(huán)境中展現(xiàn)出強(qiáng)大的適應(yīng)能力。自動(dòng)駕駛決策系統(tǒng)的挑戰(zhàn)不在于選哪個(gè)的問題,而是在于如何將不同技術(shù)有機(jī)整合,構(gòu)建出一個(gè)既前瞻又穩(wěn)健的自動(dòng)駕駛決策系統(tǒng)。只有如此,自動(dòng)駕駛技術(shù)才能真正走出實(shí)驗(yàn)室,進(jìn)入現(xiàn)實(shí)世界,為人們提供更加智能、安全的出行體驗(yàn).