神經(jīng)網(wǎng)絡驅動的安全交互式車道變換規(guī)劃
一、引言:智能駕駛的核心矛盾
在自動駕駛的眾多任務中,車道變換(Lane Changing) 一直被認為是最具挑戰(zhàn)性的決策問題。
它涉及復雜的車輛交互、駕駛員行為預測和高動態(tài)的時空約束:稍顯保守,車輛會長期滯留在車道內(nèi)影響效率;過于激進,又可能觸發(fā)危險的碰撞事件。
在過往研究中,傳統(tǒng)規(guī)劃器(如MPC)雖具可解釋性,但在動態(tài)交通中響應慢、魯棒性差;而神經(jīng)網(wǎng)絡規(guī)劃器雖然能高效學習復雜場景,卻普遍缺乏可驗證的安全保證。
為解決這一核心矛盾,美國西北大學與小馬智行(Pony.ai)團隊聯(lián)合提出了
Safety-driven Interactive Planning Framework(SafIn NN)
即安全驅動的交互式神經(jīng)網(wǎng)絡規(guī)劃框架,
通過融合學習與形式化安全驗證,使神經(jīng)網(wǎng)絡規(guī)劃首次實現(xiàn)“可解釋且可驗證”的安全控制。
二、總體架構:學習與安全的協(xié)同閉環(huán)
SafIn NN 框架將整個車道變換過程拆解為三個互補的功能模塊(圖1):
神經(jīng)網(wǎng)絡縱向與橫向規(guī)劃器(NN Planners)
輸出自車在縱向加速度 axa_xax 與橫向加速度 aya_yay 上的最優(yōu)控制;后車行為預測與攻擊性評估(Aggressiveness Assessment)
判斷目標車道后車是“禮讓”還是“封堵”,以評估交互風險;安全驅動決策與行為調(diào)整模塊(Safety-driven Adjustment)
根據(jù)形式化安全判據(jù)動態(tài)選擇三種策略:繼續(xù)變道、猶豫等待或中止回退。
這一結構的關鍵在于:
每個周期(0.1 秒)都會執(zhí)行一次“學習輸出 + 安全驗證 + 行為再決策”的循環(huán)閉環(huán),
實現(xiàn)了學習型規(guī)劃器的實時安全約束。
三、神經(jīng)網(wǎng)絡規(guī)劃器:以學習替代代價函數(shù)
1. 輸入與輸出定義
系統(tǒng)狀態(tài)向量包括:
S=[px,py,vx,vy,px,l,vx,l,px,f,vx,f]S = [p_x, p_y, v_x, v_y, p_{x,l}, v_{x,l}, p_{x,f}, v_{x,f}]S=[px,py,vx,vy,px,l,vx,l,px,f,vx,f]
其中下標 l,fl, fl,f 分別表示目標車道前車與后車。
縱向與橫向兩個神經(jīng)網(wǎng)絡各自獨立訓練,輸出控制量:
A=[ax,ay]A = [a_x, a_y]A=[ax,ay]
2. 數(shù)據(jù)與訓練
為確保神經(jīng)網(wǎng)絡規(guī)劃接近最優(yōu)解,研究者首先利用模型預測控制(MPC)在多場景下生成3600萬條樣本軌跡,并以此作為監(jiān)督信號訓練網(wǎng)絡。
MPC 的目標函數(shù)在油耗與時間之間權衡:
J=α∫ax2?dt+β(tf?t0)J = alpha int a_x^2 , dt + beta (t_f - t_0)J=α∫ax2dt+β(tf?t0)
其中 α,βalpha,betaα,β 為調(diào)節(jié)系數(shù)。訓練使用 Adam 優(yōu)化器,MSE 作為損失函數(shù)。
網(wǎng)絡步長 δt=0.1?sdelta t = 0.1,mathrm{s}δt=0.1s,輸入歸一化處理。
四、攻擊性預測模塊:學習人類駕駛行為
1. 行為模型與加速度判定
SafIn NN 引入一個神經(jīng)網(wǎng)絡評估目標車道后車的“攻擊性”(Aggressiveness)。
假設后車 F 可能屬于兩種駕駛類型:
謹慎(Cautious):會主動減速讓行;
激進(Aggressive):傾向加速阻止變道。
對應兩個加速度預測模型 a1a_1a1 與 a0a_0a0。系統(tǒng)實時計算 F 車真實加速度 ax,f?a^*_{x,f}ax,f?,并根據(jù)閾值 atha_{th}ath 判斷類型:
{∣ax,f??a1∣<∣ax,f??a0∣?ath?Cautious∣ax,f??a0∣<∣ax,f??a1∣?ath?AggressiveOtherwise?Aggressive (Default)begin{cases} |a^*_{x,f} - a_1| < |a^*_{x,f} - a_0| - a_{th} &Rightarrow text{Cautious} |a^*_{x,f} - a_0| < |a^*_{x,f} - a_1| - a_{th} &Rightarrow text{Aggressive} text{Otherwise} &Rightarrow text{Aggressive (Default)} end{cases}???∣ax,f??a1∣<∣ax,f??a0∣?ath∣ax,f??a0∣<∣ax,f??a1∣?athOtherwise?Cautious?Aggressive?Aggressive (Default)
實驗默認 ath=0.5a_{th}=0.5ath=0.5。閾值越高,預測越保守、不確定性越大。
2. 數(shù)據(jù)生成與訓練配置
基于改進版IDM(Intelligent Driver Model)生成約 100萬條樣本,參數(shù)采樣范圍:
加速度極限 ax,a=4?m/s2a_{x,a}=4,mathrm{m/s^2}ax,a=4m/s2,制動極限 ax,d=6?m/s2a_{x,d}=6,mathrm{m/s^2}ax,d=6m/s2;
期望時距 tg∈[1,2]t_gin[1,2]tg∈[1,2],安全距離 hs∈[5,8]h_sin[5,8]hs∈[5,8]。
實驗表明,當 ath=0.5a_{th}=0.5ath=0.5 時,預測誤判率為 15.9%,但不確定率高達 56.3%。
由于系統(tǒng)每 0.1 s 重新評估一次,即使出現(xiàn)短期誤判,也能在數(shù)幀內(nèi)自動糾正。
五、形式安全分析:以可證明方式約束學習結果
SafIn NN 的安全核心在于——
每次執(zhí)行決策前,必須驗證是否存在“安全逃逸軌跡”。
只要在最壞假設下仍可避免碰撞,才允許執(zhí)行該動作。
這一思想對應三個核心判據(jù):
1. 橫向逃逸軌跡(Safe Lateral Evasion)
設當前車道中心 y=0y=0y=0,目標車道中心 y=wly=w_ly=wl,車寬 wvw_vwv。
車輛可通過雙段加速度控制實現(xiàn)“最速回原”:
{py(t)=py0+vy0t1?12ay,mt12+(vy0?ay,mt1)(ty,f?t1)+12ay,m(ty,f?t1)2vy(ty,f)=0begin{cases} p_y(t) = p_{y0} + v_{y0} t_1 - frac{1}{2}a_{y,m}t_1^2 + (v_{y0}-a_{y,m}t_1)(t_{y,f}-t_1) + frac{1}{2}a_{y,m}(t_{y,f}-t_1)^2 v_y(t_{y,f}) = 0 end{cases}{py(t)=py0+vy0t1?21ay,mt12+(vy0?ay,mt1)(ty,f?t1)+21ay,m(ty,f?t1)2vy(ty,f)=0
解得 t1,ty,ft_1, t_{y,f}t1,ty,f,若回原車道中心前可避開前后車包絡區(qū),則通過驗證。
2. 縱向安全距離判定
面對前車急剎:
若前車以 ax,l,da_{x,l,d}ax,l,d 緊急制動,則需滿足:
C1=px,0?px,l+vx,0ty,f?12ax,dty,f2?vx,l22ax,l,d+pm<0C_1 = p_{x,0}-p_{x,l}+v_{x,0}t_{y,f}-frac{1}{2}a_{x,d}t_{y,f}^2 - frac{v_{x,l}^2}{2a_{x,l,d}} + p_m < 0C1=px,0?px,l+vx,0ty,f?21ax,dty,f2?2ax,l,dvx,l2+pm<0
或
C2=px,0?px,l+vx,022ax,d?vx,l22ax,l,d+pm<0C_2 = p_{x,0}-p_{x,l}+frac{v_{x,0}^2}{2a_{x,d}} - frac{v_{x,l}^2}{2a_{x,l,d}} + p_m < 0C2=px,0?px,l+2ax,dvx,02?2ax,l,dvx,l2+pm<0
其中 pmp_mpm 為最小縱向安全間距。
面對后車加速封堵:
若后車以 ax,f,aa_{x,f,a}ax,f,a 加速,則需保證:
px,0+vx,0t2+12ax,at22+(vx,0+ax,at2)22ax,d>px,f+vx,fty,f+12ax,f,aty,f2+pmp_{x,0}+v_{x,0}t_2+frac{1}{2}a_{x,a}t_2^2+frac{(v_{x,0}+a_{x,a}t_2)^2}{2a_{x,d}} > p_{x,f}+v_{x,f}t_{y,f}+frac{1}{2}a_{x,f,a}t_{y,f}^2 + p_mpx,0+vx,0t2+21ax,at22+2ax,d(vx,0+ax,at2)2>px,f+vx,fty,f+21ax,f,aty,f2+pm
成立時表示存在可逃逸空間。
3. 猶豫與中止策略
若判定無安全軌跡,則系統(tǒng)減速并調(diào)整橫向加速度:
ay=min?(max?(?vy/δt,?ay,m),ay,m)a_y = min(max(-v_y/delta t, -a_{y,m}), a_{y,m})ay=min(max(?vy/δt,?ay,m),ay,m)
使橫向速度逐步歸零,實現(xiàn)穩(wěn)定等待。
六、實驗設置與結果:從仿真到實車
1. 仿真場景
每輪仿真 10 s,時間步長 0.1 s。
隨機生成 200,000 組初始條件,覆蓋前后車速度、加速度、間距等參數(shù)。
場景難度分為四級:
寬松:ax,l∈[?6,4]a_{x,l}in[-6,4]ax,l∈[?6,4],Δp∈[7,37]Delta pin[7,37]Δp∈[7,37]
中等:ax,l∈[?6,0]a_{x,l}in[-6,0]ax,l∈[?6,0],Δp∈[7,37]Delta pin[7,37]Δp∈[7,37]
擁堵:ax,l∈[?6,4]a_{x,l}in[-6,4]ax,l∈[?6,4],Δp∈[7,17]Delta pin[7,17]Δp∈[7,17]
極端:ax,l∈[?6,0]a_{x,l}in[-6,0]ax,l∈[?6,0],Δp∈[7,17]Delta pin[7,17]Δp∈[7,17]
2. 方法比較
| 場景層級 | 方法 | 變道時長(s) | 終止橫向(m) | 成功率 | 碰撞率 |
|---|---|---|---|---|---|
| 易 | MPC | 1.90 | 3.44 | 92.6% | 7.4% |
| Only NN | 1.70 | 3.25 | 89.6% | 10.4% | |
| SafIn NN | 1.90 | 2.73 | 80.3% | 0% | |
| 中 | MPC | 1.90 | 3.46 | 87.5% | 12.5% |
| Only NN | 1.68 | 3.30 | 82.4% | 17.6% | |
| SafIn NN | 2.08 | 2.44 | 67.9% | 0% | |
| 難① | MPC | 1.90 | 3.44 | 83.1% | 16.9% |
| Only NN | 1.73 | 3.24 | 84.5% | 15.5% | |
| SafIn NN | 1.97 | 2.23 | 61.5% | 0% | |
| 難② | MPC | 1.90 | 3.46 | 71.8% | 28.2% |
| Only NN | 1.71 | 3.29 | 74.3% | 25.7% | |
| SafIn NN | 2.34 | 1.66 | 38.8% | 0% |
SafIn NN 在所有場景中實現(xiàn) 碰撞率 0%。
成功率下降的部分來自系統(tǒng)主動放棄高風險變道,而非規(guī)劃失敗。
3. 實車數(shù)據(jù)驗證
使用 Pony.ai 實采集的 48 個高密度交通場景。
結果:
SafIn NN:0 碰撞;
Only NN:12 起碰撞;
MPC:7 起輕度接觸;
SafIn NN 多次展現(xiàn)出“人類式猶豫”:在檢測到后車加速封堵后主動放棄變道,3~4 秒后重新嘗試成功。
七、分析與討論:安全、效率與人類行為的平衡
SafIn NN 的實驗結果揭示了一個重要事實:
“主動保守”是自動駕駛安全的前提。
在實際交通中,后車的不確定性極高。即便機器學習模型能高精度預測平均行為,也難以保證極端情況下的安全。
SafIn NN 通過形式化安全驗證 + 動態(tài)行為評估的協(xié)同方式,讓AI規(guī)劃具備了“安全自省”能力。
其核心價值在于:
將深度學習輸出嵌入形式安全框架;
在交互性交通中實現(xiàn)了可驗證決策;
使神經(jīng)網(wǎng)絡規(guī)劃從“黑箱決策”走向“透明安全”。
八、結論與展望
SafIn NN 提出了一種安全與智能兼容的新范式:
以神經(jīng)網(wǎng)絡學習復雜駕駛策略;
用形式化安全約束確保系統(tǒng)不越線;
通過實時交互評估實現(xiàn)人類級駕駛判斷。
未來方向包括:
引入多智能體博弈學習模型,進一步提升交互預測的魯棒性;
將安全層嵌入強化學習或端到端駕駛框架;
在城市道路、環(huán)島匯入等復雜場景中擴展驗證。
SafIn NN 不只是一個規(guī)劃算法,更像一個學習系統(tǒng)的“安全監(jiān)督者”——
它讓神經(jīng)網(wǎng)絡在自動駕駛領域真正具備“可解釋、安全、工程可行”的特征。
【編輯點評】
SafIn NN 框架代表了智能駕駛規(guī)劃從“黑箱AI”到“形式安全AI”的關鍵轉折。
它在學術上首次實現(xiàn)了神經(jīng)網(wǎng)絡規(guī)劃與安全驗證的統(tǒng)一閉環(huán),在工程上為車規(guī)級AI提供了可驗證的安全防線。
在未來的L4及更高級別自動駕駛系統(tǒng)中,類似的安全驅動架構將成為標準組件,推動AI駕駛邁向可控與可信。








評論