久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 智能計算 > 設計應用 > 神經(jīng)網(wǎng)絡驅動的安全交互式車道變換規(guī)劃

神經(jīng)網(wǎng)絡驅動的安全交互式車道變換規(guī)劃

作者: 時間:2025-11-06 來源: 收藏

一、引言:智能駕駛的核心矛盾

的眾多任務中,車道變換(Lane Changing) 一直被認為是最具挑戰(zhàn)性的決策問題。
它涉及復雜的車輛交互、駕駛員行為預測和高動態(tài)的時空約束:稍顯保守,車輛會長期滯留在車道內(nèi)影響效率;過于激進,又可能觸發(fā)危險的碰撞事件。

在過往研究中,傳統(tǒng)規(guī)劃器(如MPC)雖具可解釋性,但在動態(tài)交通中響應慢、魯棒性差;而神經(jīng)網(wǎng)絡規(guī)劃器雖然能高效學習復雜場景,卻普遍缺乏可驗證的安全保證

為解決這一核心矛盾,美國西北大學與小馬智行(Pony.ai)團隊聯(lián)合提出了

Safety-driven Interactive Planning Framework(SafIn NN)
安全驅動的交互式神經(jīng)網(wǎng)絡規(guī)劃框架
通過融合學習與形式化安全驗證,使神經(jīng)網(wǎng)絡規(guī)劃首次實現(xiàn)“可解釋且可驗證”的安全控制。


二、總體架構:學習與安全的協(xié)同閉環(huán)

SafIn NN 框架將整個車道變換過程拆解為三個互補的功能模塊(圖1):

  1. 神經(jīng)網(wǎng)絡縱向與橫向規(guī)劃器(NN Planners)
    輸出自車在縱向加速度 axa_xax 與橫向加速度 aya_yay 上的最優(yōu)控制;

  2. 后車行為預測與攻擊性評估(Aggressiveness Assessment)
    判斷目標車道后車是“禮讓”還是“封堵”,以評估交互風險;

  3. 安全驅動決策與行為調(diào)整模塊(Safety-driven Adjustment)
    根據(jù)形式化安全判據(jù)動態(tài)選擇三種策略:繼續(xù)變道猶豫等待中止回退

這一結構的關鍵在于:
每個周期(0.1 秒)都會執(zhí)行一次“學習輸出 + 安全驗證 + 行為再決策”的循環(huán)閉環(huán),
實現(xiàn)了學習型規(guī)劃器的實時安全約束。


三、神經(jīng)網(wǎng)絡規(guī)劃器:以學習替代代價函數(shù)

1. 輸入與輸出定義

系統(tǒng)狀態(tài)向量包括:

S=[px,py,vx,vy,px,l,vx,l,px,f,vx,f]S = [p_x, p_y, v_x, v_y, p_{x,l}, v_{x,l}, p_{x,f}, v_{x,f}]S=[px,py,vx,vy,px,l,vx,l,px,f,vx,f]

其中下標 l,fl, fl,f 分別表示目標車道前車與后車。

縱向與橫向兩個神經(jīng)網(wǎng)絡各自獨立訓練,輸出控制量:

A=[ax,ay]A = [a_x, a_y]A=[ax,ay]

2. 數(shù)據(jù)與訓練

為確保神經(jīng)網(wǎng)絡規(guī)劃接近最優(yōu)解,研究者首先利用模型預測控制(MPC)在多場景下生成3600萬條樣本軌跡,并以此作為監(jiān)督信號訓練網(wǎng)絡。
MPC 的目標函數(shù)在油耗與時間之間權衡:

J=α∫ax2?dt+β(tf?t0)J = alpha int a_x^2 , dt + beta (t_f - t_0)J=αax2dt+β(tf?t0)

其中 α,βalpha,betaα,β 為調(diào)節(jié)系數(shù)。訓練使用 Adam 優(yōu)化器,MSE 作為損失函數(shù)。
網(wǎng)絡步長 δt=0.1?sdelta t = 0.1,mathrm{s}δt=0.1s,輸入歸一化處理。


四、攻擊性預測模塊:學習人類駕駛行為

1. 行為模型與加速度判定

SafIn NN 引入一個神經(jīng)網(wǎng)絡評估目標車道后車的“攻擊性”(Aggressiveness)。
假設后車 F 可能屬于兩種駕駛類型:

  • 謹慎(Cautious):會主動減速讓行;

  • 激進(Aggressive):傾向加速阻止變道。

對應兩個加速度預測模型 a1a_1a1a0a_0a0。系統(tǒng)實時計算 F 車真實加速度 ax,f?a^*_{x,f}ax,f?,并根據(jù)閾值 atha_{th}ath 判斷類型:

{∣ax,f??a1∣<∣ax,f??a0∣?ath?Cautious∣ax,f??a0∣<∣ax,f??a1∣?ath?AggressiveOtherwise?Aggressive (Default)begin{cases} |a^*_{x,f} - a_1| < |a^*_{x,f} - a_0| - a_{th} &Rightarrow text{Cautious} |a^*_{x,f} - a_0| < |a^*_{x,f} - a_1| - a_{th} &Rightarrow text{Aggressive} text{Otherwise} &Rightarrow text{Aggressive (Default)} end{cases}???ax,f??a1<ax,f??a0?athax,f??a0<ax,f??a1?athOtherwise?Cautious?Aggressive?Aggressive (Default)

實驗默認 ath=0.5a_{th}=0.5ath=0.5。閾值越高,預測越保守、不確定性越大。

2. 數(shù)據(jù)生成與訓練配置

基于改進版IDM(Intelligent Driver Model)生成約 100萬條樣本,參數(shù)采樣范圍:

  • 加速度極限 ax,a=4?m/s2a_{x,a}=4,mathrm{m/s^2}ax,a=4m/s2,制動極限 ax,d=6?m/s2a_{x,d}=6,mathrm{m/s^2}ax,d=6m/s2

  • 期望時距 tg∈[1,2]t_gin[1,2]tg[1,2],安全距離 hs∈[5,8]h_sin[5,8]hs[5,8]

實驗表明,當 ath=0.5a_{th}=0.5ath=0.5 時,預測誤判率為 15.9%,但不確定率高達 56.3%
由于系統(tǒng)每 0.1 s 重新評估一次,即使出現(xiàn)短期誤判,也能在數(shù)幀內(nèi)自動糾正。


五、形式安全分析:以可證明方式約束學習結果

SafIn NN 的安全核心在于——

每次執(zhí)行決策前,必須驗證是否存在“安全逃逸軌跡”

只要在最壞假設下仍可避免碰撞,才允許執(zhí)行該動作。
這一思想對應三個核心判據(jù):

1. 橫向逃逸軌跡(Safe Lateral Evasion)

設當前車道中心 y=0y=0y=0,目標車道中心 y=wly=w_ly=wl,車寬 wvw_vwv
車輛可通過雙段加速度控制實現(xiàn)“最速回原”:

{py(t)=py0+vy0t1?12ay,mt12+(vy0?ay,mt1)(ty,f?t1)+12ay,m(ty,f?t1)2vy(ty,f)=0begin{cases} p_y(t) = p_{y0} + v_{y0} t_1 - frac{1}{2}a_{y,m}t_1^2 + (v_{y0}-a_{y,m}t_1)(t_{y,f}-t_1) + frac{1}{2}a_{y,m}(t_{y,f}-t_1)^2 v_y(t_{y,f}) = 0 end{cases}{py(t)=py0+vy0t1?21ay,mt12+(vy0?ay,mt1)(ty,f?t1)+21ay,m(ty,f?t1)2vy(ty,f)=0

解得 t1,ty,ft_1, t_{y,f}t1,ty,f,若回原車道中心前可避開前后車包絡區(qū),則通過驗證。

2. 縱向安全距離判定

面對前車急剎:

若前車以 ax,l,da_{x,l,d}ax,l,d 緊急制動,則需滿足:

C1=px,0?px,l+vx,0ty,f?12ax,dty,f2?vx,l22ax,l,d+pm<0C_1 = p_{x,0}-p_{x,l}+v_{x,0}t_{y,f}-frac{1}{2}a_{x,d}t_{y,f}^2 - frac{v_{x,l}^2}{2a_{x,l,d}} + p_m < 0C1=px,0?px,l+vx,0ty,f?21ax,dty,f2?2ax,l,dvx,l2+pm<0

C2=px,0?px,l+vx,022ax,d?vx,l22ax,l,d+pm<0C_2 = p_{x,0}-p_{x,l}+frac{v_{x,0}^2}{2a_{x,d}} - frac{v_{x,l}^2}{2a_{x,l,d}} + p_m < 0C2=px,0?px,l+2ax,dvx,02?2ax,l,dvx,l2+pm<0

其中 pmp_mpm 為最小縱向安全間距。

面對后車加速封堵:

若后車以 ax,f,aa_{x,f,a}ax,f,a 加速,則需保證:

px,0+vx,0t2+12ax,at22+(vx,0+ax,at2)22ax,d>px,f+vx,fty,f+12ax,f,aty,f2+pmp_{x,0}+v_{x,0}t_2+frac{1}{2}a_{x,a}t_2^2+frac{(v_{x,0}+a_{x,a}t_2)^2}{2a_{x,d}} > p_{x,f}+v_{x,f}t_{y,f}+frac{1}{2}a_{x,f,a}t_{y,f}^2 + p_mpx,0+vx,0t2+21ax,at22+2ax,d(vx,0+ax,at2)2>px,f+vx,fty,f+21ax,f,aty,f2+pm

成立時表示存在可逃逸空間。

3. 猶豫與中止策略

若判定無安全軌跡,則系統(tǒng)減速并調(diào)整橫向加速度:

ay=min?(max?(?vy/δt,?ay,m),ay,m)a_y = min(max(-v_y/delta t, -a_{y,m}), a_{y,m})ay=min(max(?vy/δt,?ay,m),ay,m)

使橫向速度逐步歸零,實現(xiàn)穩(wěn)定等待。


六、實驗設置與結果:從仿真到實車

1. 仿真場景

每輪仿真 10 s,時間步長 0.1 s。
隨機生成 200,000 組初始條件,覆蓋前后車速度、加速度、間距等參數(shù)。

場景難度分為四級:

  1. 寬松:ax,l∈[?6,4]a_{x,l}in[-6,4]ax,l[?6,4]Δp∈[7,37]Delta pin[7,37]Δp[7,37]

  2. 中等:ax,l∈[?6,0]a_{x,l}in[-6,0]ax,l[?6,0]Δp∈[7,37]Delta pin[7,37]Δp[7,37]

  3. 擁堵:ax,l∈[?6,4]a_{x,l}in[-6,4]ax,l[?6,4]Δp∈[7,17]Delta pin[7,17]Δp[7,17]

  4. 極端:ax,l∈[?6,0]a_{x,l}in[-6,0]ax,l[?6,0]Δp∈[7,17]Delta pin[7,17]Δp[7,17]

2. 方法比較

場景層級方法變道時長(s)終止橫向(m)成功率碰撞率
MPC1.903.4492.6%7.4%

Only NN1.703.2589.6%10.4%

SafIn NN1.902.7380.3%0%
MPC1.903.4687.5%12.5%

Only NN1.683.3082.4%17.6%

SafIn NN2.082.4467.9%0%
難①MPC1.903.4483.1%16.9%

Only NN1.733.2484.5%15.5%

SafIn NN1.972.2361.5%0%
難②MPC1.903.4671.8%28.2%

Only NN1.713.2974.3%25.7%

SafIn NN2.341.6638.8%0%

SafIn NN 在所有場景中實現(xiàn) 碰撞率 0%
成功率下降的部分來自系統(tǒng)主動放棄高風險變道,而非規(guī)劃失敗。

3. 實車數(shù)據(jù)驗證

使用 Pony.ai 實采集的 48 個高密度交通場景
結果:

  • SafIn NN:0 碰撞;

  • Only NN:12 起碰撞;

  • MPC:7 起輕度接觸;
    SafIn NN 多次展現(xiàn)出“人類式猶豫”:在檢測到后車加速封堵后主動放棄變道,3~4 秒后重新嘗試成功。


七、分析與討論:安全、效率與人類行為的平衡

SafIn NN 的實驗結果揭示了一個重要事實:

“主動保守”是安全的前提。

在實際交通中,后車的不確定性極高。即便機器學習模型能高精度預測平均行為,也難以保證極端情況下的安全。
SafIn NN 通過形式化安全驗證 + 動態(tài)行為評估的協(xié)同方式,讓AI規(guī)劃具備了“安全自省”能力。

其核心價值在于:

  • 深度學習輸出嵌入形式安全框架

  • 交互性交通中實現(xiàn)了可驗證決策;

  • 使神經(jīng)網(wǎng)絡規(guī)劃從“黑箱決策”走向“透明安全”


八、結論與展望

SafIn NN 提出了一種安全與智能兼容的新范式:

  • 神經(jīng)網(wǎng)絡學習復雜駕駛策略

  • 形式化安全約束確保系統(tǒng)不越線

  • 通過實時交互評估實現(xiàn)人類級駕駛判斷。

未來方向包括:

  1. 引入多智能體博弈學習模型,進一步提升交互預測的魯棒性;

  2. 將安全層嵌入強化學習或端到端駕駛框架;

  3. 在城市道路、環(huán)島匯入等復雜場景中擴展驗證。

SafIn NN 不只是一個規(guī)劃算法,更像一個學習系統(tǒng)的“安全監(jiān)督者”——
它讓神經(jīng)網(wǎng)絡在領域真正具備“可解釋、安全、工程可行”的特征。


【編輯點評】

SafIn NN 框架代表了智能駕駛規(guī)劃從“黑箱AI”到“形式安全AI”的關鍵轉折。
它在學術上首次實現(xiàn)了神經(jīng)網(wǎng)絡規(guī)劃與安全驗證的統(tǒng)一閉環(huán),在工程上為車規(guī)級AI提供了可驗證的安全防線。
在未來的L4及更高級別自動駕駛系統(tǒng)中,類似的安全驅動架構將成為標準組件,推動AI駕駛邁向可控與可信。


關鍵詞: 自動駕駛

評論


相關推薦

技術專區(qū)

關閉