• <ul id="ikuqo"></ul>
    <tfoot id="ikuqo"></tfoot>
    <tfoot id="ikuqo"></tfoot>
  • <ul id="ikuqo"><sup id="ikuqo"></sup></ul>
  • 閱讀 | 訂閱
    閱讀 | 訂閱
    汽車制造

    @馬斯克:只憑一個攝像頭,3D目標檢測成績也能媲美激光雷達

    Nick 來源:搜狐2018-11-27 我要評論(0 )   

    靠一個攝像頭拍下的圖像做3D目標檢測,究竟有多難?目前最先進系統的成績也不及用激光雷達做出來的1/10。 一份來自劍橋的研究,用單攝像頭的數據做出了媲美激光雷達的...

    靠一個攝像頭拍下的圖像做3D目標檢測,究竟有多難?目前最先進系統的成績也不及用激光雷達做出來的1/10。

    一份來自劍橋的研究,用單攝像頭的數據做出了媲美激光雷達的成績。

    還有好事網友在Twitter上驚呼:

    這個能不能解決特斯拉不用激光雷達的問題?馬斯克你看見了沒?

    靠“直覺”判斷

    為何人單眼能做到3D識別,而相機卻做不到?

    因為直覺。

    人能夠根據遠小近大的透視關系,得出物體的大小和相對位置關系。

    而機器識別拍攝的2D照片,是3D圖形在平面上的投影,已經失去了景深信息。

    為了識別物體遠近,無人車需要安裝激光雷達,通過回波獲得物體的距離信息。這一點是只能獲得2D信息的攝像頭難以做到的。

    為了讓攝像頭也有3D世界的推理能力,這篇論文提出了一種“正投影特征轉換”(OFT)算法。

    作者把這種算法和端到端的深度學習架構結合起來,在KITTI 3D目標檢測任務上實現了領先的成績。

    這套算法包括5個部分:

    1. 前端ResNet特征提取器,用于從輸入圖像中提取多尺度特征圖。
    2. 正交特征變換,將每個尺度的基于圖像的特征圖變換為正投影鳥瞰圖表示。
    3. 自上而下的網絡,由一系列ResNet殘余單元組成,以一種對圖像中觀察到的觀察效果不變的方式處理鳥瞰圖特征圖。
    4. 一組輸出頭,為每個物體類和地平面上的每個位置生成置信分數、位置偏移、維度偏移和方向向量等數據。
    5. 非最大抑制和解碼階段,識別置信圖中的峰值并生成離散邊界框預測。
    這種方法通過將基于圖像的特征映射到一個正交3D空間中,打破了圖像的束縛。在這個3D空間里,各個物體比例一致、距離也是有意義的。

    效果遠超Mono3D

    作者用自動駕駛數據集KITTI中3712張訓練圖像,3769張圖像對訓練后的神經網絡進行檢測。并使用裁剪、縮放和水平翻轉等操作,來增加圖像數據集的樣本數量。

    作者提出了根據KITTI 3D物體檢測基準評估兩個任務的方法:最終要求每個預測的3D邊界框應與相應實際物體邊框相交,在汽車情況下至少為70%,對于行人和騎自行車者應為50%。

    與前人的Mono3D方法對比,OFT在鳥瞰圖平均精確度、3D物體邊界識別上各項測試成績上均優于對手。

    尤其在探測遠處物體時要遠超Mono3D,遠處可識別出的汽車數量更多。甚至在嚴重遮擋、截斷的情況下仍能正確識別出物體。在某些場景下甚至達到了3DOP系統的水平。

    不僅在遠距離上,正投影特征轉換(OFT-Net)在對不同距離物體進行評估時都都優于Mono3D。

    但是與Mono3D相比,這套系統性能也明顯降低得更慢,作者認為是由于系統考慮遠離相機的物體造成的。

    在正交鳥瞰圖空間中的推理顯著提高了性能。為了驗證這一說法,論文中還進行了一項研究:逐步從自上而下的網絡中刪除圖層。

    下圖顯示了兩種不同體系結構的平均精度與參數總數的關系圖。

    趨勢很明顯,在自上而下網絡中刪除圖層會顯著降低性能。

    這種性能下降的一部分原因可能是,減少自上而下網絡的規模會降低網絡的整體深度,從而降低其代表性能力。

    從圖中可以看出,采用具有大型自上而下網絡的淺前端(ResNet-18),可以實現比沒有任何自上而下層的更深層網絡(ResNet-34)更好的性能,盡管有兩種架構具有大致相同數量的參數。

    資源

    論文:

    Orthographic Feature Transform for Monocular 3D Object Detection

    https://arxiv.org/abs/1811.08188

    作者表示等論文正式發表后,就放出預訓練模型和完整的源代碼。

    轉載請注明出處。

    激光雷達,自動駕駛
    免責聲明

    ① 凡本網未注明其他出處的作品,版權均屬于激光制造網,未經本網授權不得轉載、摘編或利用其它方式使用。獲本網授權使用作品的,應在授權范圍內使 用,并注明"來源:激光制造網”。違反上述聲明者,本網將追究其相關責任。
    ② 凡本網注明其他來源的作品及圖片,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本媒贊同其觀點和對其真實性負責,版權歸原作者所有,如有侵權請聯系我們刪除。
    ③ 任何單位或個人認為本網內容可能涉嫌侵犯其合法權益,請及時向本網提出書面權利通知,并提供身份證明、權屬證明、具體鏈接(URL)及詳細侵權情況證明。本網在收到上述法律文件后,將會依法盡快移除相關涉嫌侵權的內容。

    網友點評
    0相關評論
    精彩導讀