亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于神經(jīng)匹配的二維地圖視覺定位

3D視覺工坊 ? 來源:計算機視覺工坊 ? 2023-05-04 09:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

主要內容:

提出了一種基于人類使用的2D語義圖以亞米精度定位圖像的算法,OrienterNet,通過將BEV圖與OpenStreetMap中開放可用的全局地圖相匹配來估計查詢圖像的位置和方向,使任何人都能夠在任何可用地圖的地方進行定位。 OrienterNet只受相機姿態(tài)的監(jiān)督,學習以端到端的方式與各種地圖元素進行語義匹配。引入了一個大規(guī)模的眾包圖像數(shù)據(jù)集,該數(shù)據(jù)集以汽車、自行車和行人的不同角度在12個城市進行拍攝得到。

19a0c1dc-e8b6-11ed-ab56-dac502259ad0.png

Motivation:

作為人類,我們直觀地理解我們所看到的局部場景和我們所處場景的全局地圖之間的關系。當我們迷失在未知區(qū)域時,我們可以通過使用不同的地理特征仔細比較地圖和周圍環(huán)境來準確定位我們的位置。

傳統(tǒng)的視覺定位算法通常很復雜,其依賴于圖像匹配,并且需要冗余的3D點云和視覺描述子,而且使用激光雷達或攝影測量構建3D地圖是昂貴的,并且需要更新數(shù)據(jù)來捕捉視覺外觀的變化,3D地圖的存儲成本也很高,因為它們比基本的2D地圖大幾個數(shù)量級。這些限制了其在移動設備上執(zhí)行定位,現(xiàn)在的方法一般需要昂貴的云基礎設施。

這就引出了一個重要的問題:我們如何像人類一樣教機器從基本的2D地圖進行定位? 本文就根據(jù)這個問題提出了第一種方法,該方法可以在給定人類使用的相同地圖的情況下,以亞米精度定位單個圖像和圖像序列。

這些平面圖只對少數(shù)重要物體的位置和粗略的二維形狀進行編碼,而不對其外觀和高度進行編碼。這樣的地圖非常緊湊,尺寸比3D地圖小104倍,因此可以存儲在移動設備上,并用于大區(qū)域內的設備上定位。該解決方案也不需要隨著時間的推移構建和維護昂貴的3D地圖,也不需要收集潛在的敏感地圖數(shù)據(jù)。

其算法估計2D地圖中圖像的3-DoF姿態(tài),位置和航向。

該估計是概率性的,因此可以在多相機設備或圖像序列的多個視圖之前或跨多個視圖與不準確的GPS融合。所得到的解決方案比消費級GPS傳感器準確得多,并且基于特征匹配達到了接近傳統(tǒng)算法的精度水平。

使用的2D地圖與傳統(tǒng)地圖的區(qū)別:

19b5f110-e8b6-11ed-ab56-dac502259ad0.png

Pipeline:

19c71a4e-e8b6-11ed-ab56-dac502259ad0.png

輸入:

輸入為具有已知相機內參的圖像I。通過根據(jù)已知重力計算的單應性對圖像進行校正,使其roll和tilt為零,然后其主軸為水平。還有一個粗略的位置先驗ξ。從OpenStreetMap查詢地圖數(shù)據(jù),將其作為以ξ先驗為中心的正方形區(qū)域,其大小取決于先驗的噪聲程度。數(shù)據(jù)由多邊形、線和點的集合組成,每個多邊形、線或點都屬于給定的語義類,其坐標在同一局部參考系中給定。

OrienterNet由三個模塊組成:

1)圖像CNN從圖像中提取語義特征,并通過推斷場景的3D結構將其提升為鳥瞰圖(BEV)表示

2) OSM map由map-CNN編碼為嵌入語義和幾何信息的神經(jīng)map F。

3) 通過將BEV與地圖進行窮舉匹配來估計相機姿態(tài)ξ上的概率分布

論文技術點:

鳥瞰圖BEV推理:

從一個圖像I中推斷一個BEV表示19d83068-e8b6-11ed-ab56-dac502259ad0.png,其分布在與相機截頭體對齊的L×D的網(wǎng)格上,由N維特征組成,網(wǎng)格上每個特征都被賦予了一個置信度,有矩陣19f0af30-e8b6-11ed-ab56-dac502259ad0.png。

這種BEV表示類似于人類在地圖中自我定位時從環(huán)境中推斷出的心理地圖。

圖像和地圖之間的跨模態(tài)匹配需要從視覺線索中提取語義信息,算法依靠單目推理將語義特征提升到BEV空間,分兩步來獲得神經(jīng)BEV:

i)通過將圖像列映射到極射線來將圖像特征轉移到極坐標表示

ii)將極坐標網(wǎng)格重新采樣為笛卡爾網(wǎng)格

19ff7b78-e8b6-11ed-ab56-dac502259ad0.png

神經(jīng)map編碼:

將平面圖編碼為結合了幾何和語義的W×H神經(jīng)圖

1a0ae850-e8b6-11ed-ab56-dac502259ad0.png ?

Map data:OpenStreetMap元素根據(jù)其語義類定義為多邊形區(qū)域、多段線或單點。區(qū)域的例子包括建筑足跡、草地、停車場;線條包括道路或人行道中心線、建筑輪廓;點包括樹木、公交車站、商店等。這些元素提供了定位所需的幾何約束,而它們豐富的語義多樣性有助于消除不同姿勢的歧義。

預處理:首先將區(qū)域、線和點光柵化為具有固定地面采樣距離

▲(例如50cm/pixel)的3通道圖像。

編碼:將每個類與學習的N維嵌入相關聯(lián),生成W×H×3N的特征圖。然后通過一個CNN 將其編碼到神經(jīng)圖F中,其提取有助于定位的幾何特征。F不是歸一化的,因為我們讓Φ映射將其范數(shù)調制為匹配中的重要權重。F通常看起來像一個距離場,在那里我們可以清楚地識別建筑物的角落或相鄰邊界等獨特特征。

1a117076-e8b6-11ed-ab56-dac502259ad0.png

基于模板匹配的姿態(tài)估計:

概率體:

估計一個相機姿態(tài)ξ上的離散概率分布。這是可解釋的,并充分反映了估計的不確定性。因此在不明確的情況下,分布是多模式的。圖4顯示了各種示例。這樣就可以很容易地將姿態(tài)估計與GPS等附加傳感器相融合。計算這個體積是容易處理的,因為姿勢空間已經(jīng)減少到三維。它被離散化為每個地圖位置和以規(guī)則間隔采樣的K個旋轉。 這產(chǎn)生了W×H×K概率體積P,使得

1a2104dc-e8b6-11ed-ab56-dac502259ad0.png

它是圖像-地圖匹配項M和位置先驗的組合?:

1a29a506-e8b6-11ed-ab56-dac502259ad0.png

圖像-地圖匹配:

將神經(jīng)map F和BEV T進行窮舉匹配,得到分數(shù)體M。通過將F與由相應姿勢變換的T相關來計算每個元素,如:

1a34bfe0-e8b6-11ed-ab56-dac502259ad0.png

其中ξ(p)將2D點p從BEV變換為地圖坐標系。置信度C掩蓋相關性以忽略BEV空間的一些部分,例如被遮擋的區(qū)域。該公式得益于通過旋轉T K次并在傅立葉域中執(zhí)行作為分批乘法的單個卷積的有效實現(xiàn)。

姿態(tài)推斷: 通過最大似然估計單個姿態(tài):

1a3fc868-e8b6-11ed-ab56-dac502259ad0.png。當分布大多是單峰分布時,可以獲得一個不確定性度量,作為P在ξ*周圍的協(xié)方差。

序列和多相機定位:

單圖像定位在幾乎沒有表現(xiàn)出獨特語義元素或重復模式的位置是模糊的。當多個視圖的相對姿勢已知時,可以通過在多個視圖上積累額外的線索來消除這種挑戰(zhàn)。這些視圖可以是來自VI SLAM的具有姿勢的圖像序列,也可以是來自校準的多攝像機設備的同時視圖。圖5顯示了這樣一個困難場景的例子,通過隨著時間的推移累積預測來消除歧義。不同的幀在不同的方向上約束姿勢,例如在交叉點之前和之后。融合較長的序列會產(chǎn)生更高的精度(圖6)

1a483a5c-e8b6-11ed-ab56-dac502259ad0.png1a561974-e8b6-11ed-ab56-dac502259ad0.png

將ξi表示為視圖i的未知絕對姿態(tài),將ξij表示為視圖j到i的已知相對姿態(tài)。對于任意參考視圖i,將所有單視圖預測的聯(lián)合似然表示為:

1a668430-e8b6-11ed-ab56-dac502259ad0.png

其中1a74309e-e8b6-11ed-ab56-dac502259ad0.png

表示姿勢合成運算符。這是通過將每個概率體積Pj扭曲到參考幀i來有效計算的。也可以通過迭代扭曲和歸一化來定位連續(xù)流的每個圖像,就像經(jīng)典的馬爾可夫定位一樣。

實驗:

在駕駛和AR的背景下評估了定位模型。圖4顯示了定性示例,而圖5說明了多幀融合的有效性。

實驗表明:

1)OrienterNet在2D地圖定位方面比現(xiàn)有的深度網(wǎng)絡更有效;

2) 平面圖比衛(wèi)星圖像更準確地定位;

3) 在考慮多個視圖時,OrienterNet比嵌入式消費級GPS傳感器準確得多。

在MGL數(shù)據(jù)集的驗證拆分上評估了OrienterNet的設計。這確保了攝像機、動作、觀看條件和視覺特征的分布與訓練集相同。報告了三個閾值1/3/5m和1/3/5°時的位置和旋轉誤差的召回

1a8444de-e8b6-11ed-ab56-dac502259ad0.png

使用KITTI數(shù)據(jù)集考慮駕駛場景中的定位。為了評估零樣本性能使用了他們的Test2分割,該分割與KITTI和MGL訓練集不重疊。圖像由安裝在城市和住宅區(qū)行駛的汽車上的攝像頭拍攝,并具有RTK的GT姿勢。使用OSM map來擴充數(shù)據(jù)集。

1a8e8408-e8b6-11ed-ab56-dac502259ad0.png

用于增強現(xiàn)實(AR)的頭戴式設備的定位。 因為沒有公共基準可以為在不同的戶外空間使用AR設備拍攝的圖像提供地理對齊的GT姿勢。因此用Aria眼鏡記錄了自己的數(shù)據(jù)集。它展示了AR的典型模式,帶有嘈雜的消費者級傳感器和行人的視角和動作。 包括兩個地點:i)西雅圖市中心,有高層建筑;ii)底特律,有城市公園和較低的建筑。記錄了每個城市的幾個圖像序列,所有圖像序列都大致遵循多個街區(qū)的相同循環(huán)。

記錄每幅校準的RGB圖像和GPS測量值,并從離線專有的VI SLAM系統(tǒng)中獲得相對姿態(tài)和重力方向。通過基于GPS、VI約束和OrienterNet的預測聯(lián)合優(yōu)化所有序列來獲得偽GT全局姿態(tài)。

1a9ff68e-e8b6-11ed-ab56-dac502259ad0.png

總結:

OrienterNet是第一個深度神經(jīng)網(wǎng)絡,可以在人類使用的2D平面圖中以亞米精度定位圖像。OrienterNet通過將輸入地圖與源自視覺觀察的心理地圖相匹配,模仿人類在環(huán)境中定位自己的方式。與機器迄今為止所依賴的大型且昂貴的3D地圖相比,這種2D地圖非常緊湊,因此最終能夠在大型環(huán)境中進行設備上定位。OrienterNet基于OpenStreetMap的全球免費地圖,任何人都可以使用它在世界任何地方進行定位。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關注

    關注

    2573

    文章

    54017

    瀏覽量

    782721
  • gps
    gps
    +關注

    關注

    22

    文章

    2998

    瀏覽量

    172055

原文標題:ETH最新工作:基于神經(jīng)匹配的二維地圖視覺定位(CVPR2023)

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中航光電推出二維FA光纖陣列組件

    中航光電研制的二維FA光纖陣列組件作為OCS光交換設備的關鍵組件,用于實現(xiàn)陣列光信號的輸入和輸出功能;該組件集成了二維光纖陣列和二維透鏡陣列,通過者的精確耦合對準,實現(xiàn)準直光束的穩(wěn)定
    的頭像 發(fā)表于 09-10 18:19 ?1583次閱讀

    類腦視覺芯片里程碑突破:復旦團隊首創(chuàng)二維半導體DRAM仿生神經(jīng)

    在類腦視覺芯片領域,復旦大學的研究團隊取得了令人矚目的突破,他們聯(lián)合研發(fā)出了基于二維半導體DRAM的仿生神經(jīng)元。這一成果為類腦計算與視覺處理的融合發(fā)展帶來了新的曙光,有望革新當前人工智
    的頭像 發(fā)表于 08-15 17:00 ?628次閱讀
    類腦<b class='flag-5'>視覺</b>芯片里程碑突破:復旦團隊首創(chuàng)<b class='flag-5'>二維</b>半導體DRAM仿生<b class='flag-5'>神經(jīng)</b>元

    基于STM32的二維碼識別源碼+二維碼解碼庫lib

    基于STM32的二維碼識別源碼+二維碼解碼庫lib,推薦下載!
    發(fā)表于 05-28 22:04

    基于LockAI視覺識別模塊:C++二維碼識別

    二維碼識別是視覺模塊經(jīng)常使用到的功能之一。我們將演示如何使用基于瑞芯微RV1106的LockAI視覺識別模塊進行二維碼識別。 源代碼網(wǎng)址:https://gitee.com/Lockz
    發(fā)表于 05-26 09:57

    基于LockAI視覺識別模塊:C++二維碼識別

    二維碼識別是視覺模塊經(jīng)常使用到的功能之一。我們將演示如何使用基于瑞芯微RV1106的LockAI視覺識別模塊進行二維碼識別。
    的頭像 發(fā)表于 05-26 09:42 ?591次閱讀
    基于LockAI<b class='flag-5'>視覺</b>識別模塊:C++<b class='flag-5'>二維</b>碼識別

    基于STM32的二維碼識別源碼+二維碼解碼庫lib

    基于STM32的二維碼識別源碼+二維碼解碼庫lib項目實例下載! 純分享帖,需要者可點擊附件免費獲取完整資料~~~【免責聲明】本文系網(wǎng)絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請第一時間告知,刪除內容!
    發(fā)表于 05-23 20:45

    JCMsuite中對二維光柵的定義和仿真

    光柵是光衍射的周期性結構。它能把入射的光束衍射成幾束向不同方向發(fā)散的光束。 二維光柵 二維光柵在兩個水平方向上都具有周期性。存在兩個晶格矢量因此當幾何結構移位一個晶格矢量時, 下圖顯示了一個正方形
    發(fā)表于 05-19 08:53

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】+ROS2應用案例

    這一部分內容,我掌握了如何在ROS 2中實現(xiàn)SLAM,這對于提高機器人的自主導航能力具有重要意義。 其他內容概述 除了二維碼識別和SLAM技術,書中還介紹了其他視覺應用和地圖構建的內容,如
    發(fā)表于 04-27 11:42

    二維碼讀取器是干嘛的

    二維碼讀取器(用于二維碼讀取的機器),作為一種現(xiàn)代化的自動識別技術設備,正日益滲透到我們生活的方方面面。從商場購物到物流配送,從醫(yī)療管理到工業(yè)生產(chǎn)線,二維碼讀取器憑借其高效、準確的讀取能力,發(fā)揮
    的頭像 發(fā)表于 03-17 15:57 ?727次閱讀
    <b class='flag-5'>二維</b>碼讀取器是干嘛的

    二維影像掃描引擎可以應用于哪些行業(yè)?

    二維影像掃描引擎,作為自動識別技術的重要組成部分,以其高效、精準的掃描能力,在多個行業(yè)領域內展現(xiàn)出廣泛的應用前景。這些引擎不僅提升了數(shù)據(jù)采集的效率和準確性,還推動了各行業(yè)的數(shù)字化轉型進程。零售業(yè):在
    的頭像 發(fā)表于 02-14 14:59 ?791次閱讀
    <b class='flag-5'>二維</b>影像掃描引擎可以應用于哪些行業(yè)?

    二維掃碼頭有效掃描距離是多少,影響二維掃描頭掃碼的因素有哪些

    在現(xiàn)代科技快速發(fā)展的今天,二維碼掃描已經(jīng)成為我們日常生活和工作中不可或缺的一部分,無論是支付、物流追蹤還是信息獲取,都離不開二維碼的掃描。那么,二維掃描頭的有效掃描距離究竟是多少?又有哪些因素會
    的頭像 發(fā)表于 01-15 16:26 ?1711次閱讀
    <b class='flag-5'>二維</b>掃碼頭有效掃描距離是多少,影響<b class='flag-5'>二維</b>掃描頭掃碼的因素有哪些

    王欣然教授團隊提出基于二維材料的高效稀疏神經(jīng)網(wǎng)絡硬件方案

    two-dimensional semiconductor ferroelectric field-effect transistors”為題發(fā)表最新研究進展,報道了基于二維材料的高效稀疏神經(jīng)網(wǎng)絡硬件解決方案
    的頭像 發(fā)表于 01-13 10:41 ?777次閱讀
    王欣然教授團隊提出基于<b class='flag-5'>二維</b>材料的高效稀疏<b class='flag-5'>神經(jīng)</b>網(wǎng)絡硬件方案

    RS232接口的二維影像掃描引擎,廣泛用在醫(yī)療設備上掃一二維

    在醫(yī)療設備領域,二維碼的應用日益廣泛,它作為信息的快速傳遞和識別手段,為醫(yī)療管理、患者追蹤、設備維護等環(huán)節(jié)帶來了極大的便利。而在這背后,RS232接口的二維影像掃描引擎扮演著至關重要的角色,它以
    的頭像 發(fā)表于 12-23 16:02 ?849次閱讀
    RS232接口的<b class='flag-5'>二維</b>影像掃描引擎,廣泛用在醫(yī)療設備上掃一<b class='flag-5'>維</b><b class='flag-5'>二維</b>碼

    工業(yè)視覺在條碼/二維碼識別領域的應用

    工業(yè)視覺技術在條碼和二維碼識別領域的應用日益廣泛,它通過高精度的圖像處理和識別算法,實現(xiàn)了對條碼和二維碼的快速、準確識別。這項技術不僅提高了生產(chǎn)效率,還降低了人工錯誤的可能性,確保了產(chǎn)品質量和追溯性
    的頭像 發(fā)表于 11-18 16:28 ?1035次閱讀
    工業(yè)<b class='flag-5'>視覺</b>在條碼/<b class='flag-5'>二維</b>碼識別領域的應用

    二維碼識讀設備有哪些類型

    隨著二維碼應用的日益普及,各類二維碼識讀設備也應運而生。這些設備不僅極大地方便了我們的日常生活,也為企業(yè)提供了更加高效便捷的服務。那么,你知道二維碼識讀設備都有哪些類型嗎?讓我們一起來了解一下。據(jù)
    的頭像 發(fā)表于 11-05 16:10 ?1387次閱讀
    <b class='flag-5'>二維</b>碼識讀設備有哪些類型