專欄中心

EEPW首頁 > 專欄 > 智能駕駛感知算法的演進

智能駕駛感知算法的演進

發布人：地平線開發者時間：2026-04-07 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

發布文章

從 2D 感知到 BEV 世界模型

一、問題的本質：自動駕駛究竟要“理解”什么

智能駕駛中的感知算法，并不是單純回答“畫面里有什么”，而是要回答三個更困難的問題：

世界在三維空間中是什么樣的
不同傳感器看到的是否是同一個世界
這個世界在時間維度上如何連續變化

早期感知算法的發展，很長一段時間都停留在“看清楚圖像內容”，而不是“理解真實世界結構”。 BEV（Bird’s Eye View）路線的出現，本質上是一場從圖像認知到世界建模的范式遷移。

二、2D Image-space 感知：從“能識別”開始，但止步于圖像1.典型范式

最早一代智駕感知算法幾乎全部工作在 Image-space：

輸入：單目或多目 RGB 圖像
輸出：2D bounding box、2D segmentation mask
核心任務：檢測車輛、行人、交通標志

這一階段的算法高度繼承了通用計算機視覺的發展成果，如 Faster R-CNN、YOLO、Mask R-CNN 等。

2.這一代真正解決了什么問題

2D 感知第一次讓自動駕駛系統具備了“看懂畫面”的能力：

能穩定識別物體類別
能在復雜背景中找到關鍵目標
能在消費級算力上實時運行

這是必要的一步，沒有這一代，后續所有感知算法都無從談起。

3.根本性缺陷

Image-space 感知存在無法通過模型規模解決的結構性問題：

沒有真實幾何
多相機之間缺乏統一坐標系
所有空間關系只是投影結果

Image-space 感知并不真正理解世界，而是在理解像素。

三、LiDAR-first 時代：幾何優先，但語義不足1.點云帶來的改變

LiDAR 的引入讓感知系統第一次擁有真實三維信息：

點云天然位于世界坐標系
距離、尺寸、位置無需推測
3D Box 成為可能

VoxelNet、PointPillars、SparseConv 等方法逐漸成為主流。

2.解決的關鍵問題

準確的空間幾何
穩定的目標定位
易于與規劃模塊對接

在空間可信度上，LiDAR-first 路線顯著優于純視覺。

3.局限性

成本與功耗高
點云語義信息稀疏
視覺信息利用不足

單一傳感器難以同時滿足幾何與語義需求。

四、BEV：統一世界坐標系的關鍵一步

BEV（Bird’s Eye View）不是一種模型，而是一種世界表示方式：

所有感知結果統一到俯視視角
多相機天然對齊
空間關系直觀，利于規劃與預測

BEV 的出現，標志著感知開始圍繞“決策友好性”設計。

1.第一代 BEV 的實現方式

早期 BEV 依賴顯式幾何：

深度估計
相機標定
投影矩陣

通過 image → depth → world → BEV 的方式完成映射。

2.暴露的問題

深度誤差被放大
對噪聲極其敏感
單幀 BEV 抖動明顯

問題不在 BEV，而在從 image 到 BEV 的方式。

五、BEVFormer：讓模型學習投影關系

BEVFormer 的核心思想是：

不再顯式計算深度，而是讓模型學習 BEV 與圖像之間的對應關系。

1.核心機制

BEV Query：BEV 空間中的查詢點
Spatial Cross-Attention：BEV 與多相機特征交互
Temporal Self-Attention：引入歷史 BEV

2.帶來的突破

擺脫顯式深度建模
自動學習復雜投影關系
時序建模提升穩定性

BEVFormer 讓 camera-only BEV 感知在精度上具備競爭力。

3.新問題

Transformer 計算復雜
顯存與算力消耗大
工程部署成本高

BEVFormer 是算法正確性的高峰，但也引入了工程壓力。

六、BEVFusion：多模態 BEV 的系統化嘗試1.出發點

Camera 語義強但幾何不穩，LiDAR 幾何穩但語義弱。

BEVFusion 試圖在 BEV 空間融合兩者優勢。

2.核心思想

Camera → BEV
LiDAR → BEV
在 BEV 空間完成融合

3.優勢

幾何穩定性提升
多模態互補自然
極端場景魯棒性更強

4.代價

模型結構復雜
多分支系統維護成本高
推理鏈路變長

BEVFusion 提升了系統完整性，但工程復雜度顯著上升。

七、Sparse4D：向現實系統妥協的 BEV1.核心判斷

Dense BEV 中，大多數網格并無有效信息，計算存在浪費。

2.核心變化

Dense BEV → Sparse 表示
空間建模 → Object-centric 建模
強調時序一致性

3.解決的問題

顯著降低計算量
更易滿足實時性
更接近可部署系統需求

4.取舍

全局建模能力下降
更依賴 tracking 與初始化
系統設計復雜度提升

Sparse4D 是工程理性下的選擇。

八、數據與傳感器：算法演進的真正推手1.數據集演進

單幀 → 長時序
單傳感器 → 多模態
公共數據 → 私有閉環

數據形態直接塑造算法結構。

2.傳感器現實約束

Camera 數量增加
LiDAR 成本博弈
Radar 作為補充角色

這些現實因素持續影響 BEV 路線的取舍。

九、結語：BEV 是基礎設施，而不是終點

BEV 的意義不在于某個具體模型，而在于：

自動駕駛系統第一次擁有了統一的世界表示。

未來模型名稱可能變化，但在世界坐標系中建模、在時間維度中理解世界，將成為不可逆的方向。

專欄文章內容及配圖由作者撰寫發布，僅供工程師學習之用，如有侵權或者其他違規問題，請聯系本站處理。聯系我們

關鍵詞：算法 自動駕駛 算法工具鏈 地平線 征程5

加密算法之MD5算法

加密算法之MD5算法...

資源下載加密算法加密算法 MD5算法 2007-02-16

數字PID控制算法之一

數字PID控制算法之一...

資源下載 PID PID控制算法 2007-12-28

PID算法

PID算法...

資源下載 PID 算法誤差 2007-02-16

[轉帖]us/os就緒表的維護算法分析

amine 2002-05-17

76-81GHz自動駕駛CMOS RADAR

查看我們創新型高度集成式28nm CMOS RADAR雷達解決方案的系統級演示，該方案將角分辨率指數級升高，以支持面向OEM、一級廠商、創業公司和顛覆性初創公司的高度自動化的駕駛應用。了解有關汽車解決方案的更多信息...

視頻 ADI 自動駕駛 CMOS RADAR 2018-05-31

自動駕駛的現狀與未來（節選）

在本節選視頻中，ADI公司自動交通和汽車安全副總裁Chris Jacobs探討自動駕駛的現狀和未來，及其對社會的影響。...

視頻 ADI 自動駕駛 2020-03-16

采用Mean-Shift和Camshift算法相結合的火焰視頻圖像跟蹤設計

設計方案采用 Mean-Shift Camshift 算法相結合 2011-06-27

簡單實用的單片機CRC 快速算法

提供兩個實用的、能夠在單片機上通過軟件來實現的CRC 快速算法，其中一個適用于51 系列等單片機，另一個適用于PIC 單片機，這兩種算法十分簡單快捷。...

資源下載 CRC 算法單片機 2007-02-16

恩智浦第三代雷達收發器助力高性能成像雷達規模量產，賦能L2+至L4級自動駕駛

采用RFCMOS工藝的汽車雷達收發器，集成8個發射通道和8個接收通道，助力實現多達576個天線通道的新一代成像雷達傳感器，全面服務高級駕駛輔助系統（ADAS）和自動駕駛應用。最新動態恩智浦半導體（NXP Se...

汽車電子恩智浦雷達收發器成像雷達自動駕駛 2026-03-27

CRC算法原理及C語言實現

本文從理論上推導出CRC算法實現原理，給出三種分別適應不同計算機或微控制器硬件環境的C語言程序。讀者更能根據本算法原理，用不同的語言編寫出獨特風格更加實用的CRC計算程序。...

資源下載 CRC 算法 C語言 2007-02-16

實時訓練駕駛人工智能

自動駕駛是物理 AI 領域難度最高的問題之一。自動駕駛系統必須實時解讀混亂、動態變化的環境，應對不確定性、預測人類行為，并在海量場景與極端工況下安全運行。在通用汽車，我們的出發點很簡單：道路上絕大多數場景都是可預測的，但...

汽車電子自動駕駛物理 AI 多智能體強化學習模擬器 GM 2026-03-31

日產聯手優步與 Wayve，計劃在東京推出自動駕駛出租車服務

日產、優步（Uber）與 Wayve 將展開合作，計劃今年在東京街頭投放自動駕駛出租車。該項目將采用日產聆風（Nissan Leaf）純電動車，搭載 Wayve 公司的高級駕駛輔助系統（ADAS）技術。Wayve 首席執...

汽車電子日產優步 Wayve 東京自動駕駛出租車 2026-03-16

基于LPC2138的血壓測量算法開發平臺電路圖

設計方案基于 LPC2138 血壓測量算法開發平臺電路圖 2010-01-20

ZF與SiliconAuto推出用于自動駕駛的實時I/O芯片

ZF 與 SiliconAuto 發布了一款全新芯片架構，旨在簡化自動駕駛高性能計算。兩家公司在 2026 德國嵌入式展會（embedded world 2026）上，展示了這款實時 I/O 接口芯片搭配微控制器的方案，...

汽車電子 ZF SiliconAuto SoC ADAS 自動駕駛芯片 2026-03-16

為什么可擴展高性能 SoC 是自動駕駛汽車的未來

總結在中央計算平臺的幫助下，汽車行業的自動駕駛水平越來越高。TDA5 系列等 SoC 通過集成式 C7? NPU 和芯片就緒型設計提供安全、高效的 AI 性能。這些 SoC 使汽車制造商能夠更輕松地實現 ADAS ...

汽車電子 SoC 自動駕駛 2026-03-06

賦能自動駕駛和機器人感知，讀懂二維可尋址VCSEL | 硬科技有點意思

你是否想過，深夜奔馳在高速公路上的智能汽車，如何精準識別側后方突然逼近的車輛？或者，你家中的掃地機器人，又是如何在桌椅腿叢林中靈活穿梭，不碰倒一杯水？這背后，都離不開一項被稱為機器“眼睛”的核心技術——激光雷達。而激光雷...

機器人 VCSEL 自動駕駛具身智能 2026-03-20

攜手ADI贏得未來

從自動駕駛到醫療健康，我們的客戶能夠利用相關數據和核心見解展開創新。我們將現實世界轉化為可操作的見解，從而不斷推動客戶實現行業變革。...

視頻 ADI 自動駕駛醫療健康 2019-11-08

vxwokrs下靜態圖像壓縮算法（上）

C-- 2004-07-26

英偉達宣布與比亞迪、吉利展開自動駕駛業務合作

在美國加州圣何塞舉行的2026年GTC大會上，英偉達宣布將自動駕駛汽車開發業務合作拓展至現代汽車、日產汽車、五十鈴汽車，以及中國車企比亞迪與吉利。新合作圍繞英偉達「Drive Hyperion」自動駕駛平臺展開，該系統助...

英偉達比亞迪吉利自動駕駛 2026-03-17

ADI：傳感技術助力未來自動駕駛的發展

ADI公司自動駕駛和汽車安全部副總裁Chris Jacobs介紹ADI的傳感技術如何助力未來自動駕駛的發展，以及自動駕駛技術如何造福社會和挽救生命。...

視頻 ADI 自動駕駛 2020-03-16

采埃孚與SiliconAuto推出自動駕駛實時I/O接口芯片

采埃孚（ZF）與 SiliconAuto 共同發布了一款全新芯片架構，旨在簡化自動駕駛高性能計算。兩家公司在德國紐倫堡舉辦的Embedded World 2026展會上，展示了這款實時 I/O 接口芯片與微控制器的組合方...

汽車電子采埃孚 ZF SiliconAuto 自動駕駛實時I/O 接口芯片 2026-03-16

目標跟蹤算法在紅外熱成像跟蹤技術上的應用

設計方案目標跟蹤算法紅外成像技術上應用 2009-09-03

加快實現自動駕駛（完整小組討論）

汽車行業正在經歷數字化轉型，需要處理自動駕駛化方面極為復雜的創新。觀看專家小組討論的視頻，其中包括ADI公司自動駕駛和安全事業部副總裁Chris Jacobs。...

視頻 ADI 自動駕駛 2020-06-12

數字PID控制及其改進算法的應用

設計方案數字控制及其改進算法應用 2011-05-11

計算機科學與技術反思錄(2)

liujt_ic 2003-06-06

英偉達 “全天候” 芯片實現毫秒級人臉檢測

全天候視覺系統可應用于自動駕駛汽車、機器人，或幫助消費電子設備在無人時關閉屏幕以節省功耗。但要實現這類應用，這些系統必須最大限度降低自身功耗。英偉達研究人員開發的全天候計算機視覺系統可在不到 1 毫秒內檢測到人臉。這款人...

汽車電子英偉達人臉識別視覺處理自動駕駛機器人 2026-03-24

地平線HSD引領智能駕駛普惠新時代

簡介作為國內首發一段式端到端大模型的全場景輔助駕駛系統，HSD以地平線征程芯片為核心技術支撐，構建起覆蓋城區、高速、鄉間小路、停車場的全場景適配能力。在連續彎道、多出口大型環島等復雜道路拓撲環境中，能實現精準感知與絲滑通...

汽車電子地平線 HSD 多維具身智能計算平臺機器人 2026-03-24

無線傳感器網絡低功耗分簇路由算法設計

設計方案無線傳感器網絡功耗路由算法設計 2012-09-07

有關指紋算法

wsf999 2004-08-06

求FSK信號的解調算法，主要是鐵路上的移頻信號!

dhlwq007 2004-08-04

更多 培訓課堂

更多焦點

更多視頻

久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠