久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

博客專欄

EEPW首頁 > 博客 > 春假返程堵車 | AI“高速”檢測輕而易舉監測大家安全

春假返程堵車 | AI“高速”檢測輕而易舉監測大家安全

發布人:CV研究院 時間:2022-02-10 來源:工程師 發布文章

春節返程大軍開始了!不管是離開小城鎮還是進入大城市,每個高速路口都是堵車,現在人工智能愈來愈發達,不再用通過交警得知高速公路上的案發事件,現在都是攝像機覆蓋,AI可以通過鏡頭&算法檢測到行駛的車輛,如果有交通事故都是第一時間傳達交警來處理。以至于有些路段都是通過無人機來進行交通事故處理!


一、簡要

Single-stage目標檢測方法因其具有實時性強、檢測精度高等特點,近年來受到廣泛關注。通常,大多數現有的single-stage檢測器遵循兩個常見的實踐:它們使用在ImageNet上預先訓練的網絡主干來完成分類任務,并使用自頂向下的特征金字塔表示來處理規模變化。

微信圖片_20220210171933.gif

好比在返程高速路上,車輛較多,而且車輛的行駛速度不一,大多數都是高速行駛狀態中,所以有研究者研究了一個single-stage檢測框架,它結合了微調預訓練模型和從零開始訓練的優點。新框架構成了一個標準的網絡,使用一個預先訓練的主干網絡和一個并行的輕型輔助網絡從零開始訓練。

微信圖片_20220210171936.png

此外,研究者認為通常使用的自頂向下的金字塔表示只關注于將高級語義從頂層傳遞到底層。然而在新的檢測框架中引入了一個雙向網絡,它可以有效地傳遞中低層次和高層次的語義信息。

二、背景&動機

研究表明,訓練檢測模型從零開始解決這個問題,導致精確定位。但是與基于微調的對應網絡相比,從零開始訓練時間花費多。因此研究者引入一個訓練模型,將訓練前的和從零開始訓練的優點結合起來,該框架使用一個虛報臉前的主干和一個從零開始訓練的淺輔助網絡。提出的方法相比baseline在AP指標上分別提高了7.4%和4.2%。在COCO測試集上,固定300×300輸入,提出的以ResNet為backbone的檢測器在單級推理方面超過了現有的單級檢測方法,AP達到了34.3 ,在一個Titan X GPU上時間為19毫秒,同時兼顧了精度和速度。

微信圖片_20220210171937.png

現在遇到的問題:

小目標檢測的難點

小目標檢測是一個具有挑戰性的問題,它既需要精確描述對象的低層/中層信息,也需要區分目標對象與背景或其他對象類別的高級語義信息。

近來的one-stage探測器的目標是獲得與two-stage相近的檢測精度。
盡管在大中型目標上效果較好,但這些探測器在小目標上的性能卻低于預期。
例如:
當使用一個500×500的輸入時,使用RetinaNet在COCO數據集上,
AP為47,但在小目標上,AP只有 14。

預訓練網絡的利弊

主流的one-stage目標檢測框架的通用策略是:利用一個經過ImageNet預訓練的backbone完成分類任務。然后利用檢測目標的數據集進行微調,從而達到快速收斂的效果。但是目標檢測中的分類任務和定位任務之間仍然存在較大差異,尤其是在目標框重疊閾值高的情況下。

在ICCV2019Kaiming He的最新論文中,也對利用ImageNet
進行預訓練然后fine-tune這種模式進行了思考,并且認為從
零開始訓練檢測模型,有助于精確定位。但是另一方面,與典
型的基于微調的網絡相比,從零開始訓練非常深的網絡需要的
訓練時間要長得多。

三、新框架

微信圖片_20220210171939.png

新框架圖圖顯示了由三個主要組件組成的總體架構:標準SSD網絡,輕量級暫存網絡(LSN)和雙向網絡。

標準SSD使用預先訓練的網絡主干。因此將來自標準SSD層的功能(conv4_3,FC_7,conv8_2,conv9_2,conv10_2和conv11_2)稱為主干特征,因為它們源自預先訓練的網絡主干。研究者采用VGG-16作為主干網絡。輕量級暫存網絡(LSN)產生低/中級特征表示,然后將其注入到后續標準預測層的主干特征中以改善其性能。然后,將當前層和前一層的結果特征以自下而上的方式組合到雙向網絡中。雙向網絡中的自頂向下方案包含獨立的并行連接,以將高級語義信息從網絡的較后一層注入到前一層。

不同之處:

新框架中雙向網絡與現有的幾個單級檢測器使用的特征金字塔網絡(FPN)相比有以下不同之處。

首先,FPN的自底向上部分遵循了標準中使用的CNN的金字塔特征層次結構SSD的框架。FPN和SSD的自底向上部分都遵循骨干網的前饋計算,建立了特征層次結構。除了FPN/標準SSD中的自底向上部分外,新框架中的雙向網絡中的自底向上方案以級聯的方式將前一層的特性傳播到后一層。此外,FPN中的topdown金字塔通過級聯操作逐層融合了許多CNN層。在雙向網絡的自頂向下方案中,預測層通過獨立的并行連接進行融合,而不是逐層逐層的級聯/順序融合。

LSN Feature Extraction

在現有檢測框架中常用的特征提取策略包括從網絡主干,如VGG-16,在多個卷積塊和最大池層的重復堆棧中提取特征,以產生語義強的特征(見下圖)。

微信圖片_20220210171941.png

這種特征提取策略有利于偏好平移不變性的圖像分類任務。與圖像分類不同,目標檢測還需要精確的目標描述,其中局部低/中水平特征(如紋理)信息也是至關重要的。為了補償預先訓練的網絡的主干特征中的信息損失,在新框架的LSN中使用了另一種特征提取方案,如上圖(b)。

首先,通過池化操作將輸入圖像下采樣到第一SSD預測層的目標大小。然后,得到的下采樣圖像通過輕量級串行操作(LSO),包括卷積、batch-norm和ReLU層。請注意,LSN是用隨機初始化從零開始訓練的。它遵循類似的金字塔特征層次,如標準SSD。

四、實驗

image.png

[18]  Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, and Piotr Dollr. Focal loss for dense object detection. In ICCV, 2017

image.png

image.png

微信圖片_20220210171947.png

*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



關鍵詞: AI

相關推薦

技術專區

關閉