訓(xùn)練一個高準確率的檢測模型需要大量精細標注的圖片數(shù)據(jù),其成本很高。本文提出了一種弱監(jiān)督協(xié)同學(xué)習框架,僅使用粗略標簽的圖片訓(xùn)練目標檢測模型,測試結(jié)果顯示其定位精確率和檢測準確率均顯著優(yōu)于目前最先進的方法。
目標檢測是機器視覺的基本問題,在視頻監(jiān)控、無人駕駛等場景都有廣泛應(yīng)用。隨著深度學(xué)習的興起,近年來涌現(xiàn)了大量優(yōu)秀的目標檢測模型。然而,訓(xùn)練一個高準確率的檢測模型需要大量的以包圍框形式精細標注的圖片數(shù)據(jù)作為模型監(jiān)督條件,需要花費大量的人力物力。
同時,我們可以從互聯(lián)網(wǎng)輕松獲取海量粗標注的圖片,如利用Flickr的標簽。因此,研究如何在弱監(jiān)督條件下,即僅提供粗略圖片類別標注,訓(xùn)練目標檢測模型,具有重要的意義。已有學(xué)者探索了基于多示例學(xué)習構(gòu)建弱監(jiān)督條件下的目標檢測模型學(xué)習方法,但是模型的精確度仍然難以令人滿意。
論文:Collaborative Learning for Weakly Supervised Object Detection

論文鏈接:https://arxiv.org/abs/1802.03531
本論文提出了一種弱監(jiān)督協(xié)同學(xué)習(WSCL)的框架,將弱監(jiān)督學(xué)習網(wǎng)絡(luò)和強監(jiān)督學(xué)習網(wǎng)絡(luò)連接成為一個整體網(wǎng)絡(luò),通過一致性損失約束強監(jiān)督和弱監(jiān)督學(xué)習網(wǎng)絡(luò)具有相似的預(yù)測結(jié)果,通過強監(jiān)督和弱監(jiān)督學(xué)習網(wǎng)絡(luò)間部分特征共享保證兩個網(wǎng)絡(luò)在感知水平上的一致性,從而實現(xiàn)強監(jiān)督和弱監(jiān)督學(xué)習網(wǎng)絡(luò)的協(xié)同增強學(xué)習。弱監(jiān)督協(xié)同學(xué)習框架結(jié)構(gòu)如下圖所示:

弱監(jiān)督協(xié)同學(xué)習框架(以目標檢測為例)
基于上述弱監(jiān)督協(xié)同學(xué)習框架,論文設(shè)計了一個端到端的弱監(jiān)督協(xié)同檢測網(wǎng)絡(luò)(WSCDN),弱監(jiān)督和強監(jiān)督的檢測模塊分別采用了目前最優(yōu)秀WSDDN和RCNN網(wǎng)絡(luò)結(jié)構(gòu)。其網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示。

弱監(jiān)督協(xié)同目標檢測學(xué)習模型
在每次學(xué)習迭代中,整個目標檢測網(wǎng)絡(luò)只將圖像級標簽作為弱監(jiān)督,并且通過預(yù)測一致性損失并行優(yōu)化強監(jiān)督和弱監(jiān)督檢測網(wǎng)絡(luò)。
下圖是WSCDN訓(xùn)練時,強監(jiān)督和弱監(jiān)督檢測網(wǎng)絡(luò)準確率的變化曲線。

可以看出,在訓(xùn)練的初始階段,弱監(jiān)督檢測網(wǎng)絡(luò)準確率高于強監(jiān)督檢測網(wǎng)絡(luò)。隨著協(xié)同訓(xùn)練輪次的增多,兩者的準確率均逐漸上升,但強監(jiān)督檢測網(wǎng)絡(luò)提升的速度更快,并很快超越弱監(jiān)督檢測網(wǎng)絡(luò)。在整個訓(xùn)練過程中,兩類檢測網(wǎng)絡(luò)相互協(xié)同,達到了共同提高的效果。
我們比較了弱監(jiān)督協(xié)同檢測網(wǎng)絡(luò)與其他相關(guān)弱監(jiān)督檢測方法在PASCAL VOC 2007測試圖片上的效果(見下圖)。其中,IW是單獨訓(xùn)練得到的弱監(jiān)督檢測模型,CSS是分開迭代訓(xùn)練得到的強監(jiān)督檢測模型,CLW和CLS分別是通過弱監(jiān)督協(xié)同檢測網(wǎng)絡(luò)得到的強監(jiān)督和弱監(jiān)督檢測網(wǎng)絡(luò)??梢钥闯?,我們的強監(jiān)督檢測網(wǎng)絡(luò)明顯優(yōu)于其他檢測器網(wǎng)絡(luò),表現(xiàn)在可以得到更全面和更緊湊的包圍框預(yù)測。
我們用PASCAL VOC 2007和PASCAL VOC 2012數(shù)據(jù)集進行了測試。結(jié)果表明,弱監(jiān)督協(xié)同檢測網(wǎng)絡(luò)的定位精確率以及檢測準確率均顯著優(yōu)于目前最先進的方法。
弱監(jiān)督協(xié)同檢測網(wǎng)絡(luò)與其他目前最先進的方法在PASCAL VOC 2007 測試數(shù)據(jù)集上檢測精確度的比較(AP) (%)

弱監(jiān)督協(xié)同檢測網(wǎng)絡(luò)與其他目前最先進的方法在PASCAL VOC 2007 trainval set 上定位精確度的比較(CorLoc) (%)

弱監(jiān)督協(xié)同檢測網(wǎng)絡(luò)與其他目前最先進的方法在PASCAL VOC 2012 測試數(shù)據(jù)集上檢測精確度的比較(AP) (%)

弱監(jiān)督協(xié)同檢測網(wǎng)絡(luò)與其他目前最先進的方法在PASCAL VOC 2012 trainval set 上定位精確度的比較(CorLoc) (%)

-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
55文章
11293瀏覽量
108587 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
8059瀏覽量
92568 -
無人駕駛
+關(guān)注
關(guān)注
99文章
4235瀏覽量
125718
原文標題:IJCAI Oral:弱監(jiān)督實現(xiàn)精確目標檢測,上交大提出協(xié)同學(xué)習框架
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
使用MATLAB進行無監(jiān)督學(xué)習
深非監(jiān)督學(xué)習-Hierarchical clustering 層次聚類python的實現(xiàn)
如何用卷積神經(jīng)網(wǎng)絡(luò)方法去解決機器監(jiān)督學(xué)習下面的分類問題?
基于半監(jiān)督學(xué)習框架的識別算法
你想要的機器學(xué)習課程筆記在這:主要討論監(jiān)督學(xué)習和無監(jiān)督學(xué)習
如何用Python進行無監(jiān)督學(xué)習
機器學(xué)習算法中有監(jiān)督和無監(jiān)督學(xué)習的區(qū)別
最基礎(chǔ)的半監(jiān)督學(xué)習
半監(jiān)督學(xué)習最基礎(chǔ)的3個概念
為什么半監(jiān)督學(xué)習是機器學(xué)習的未來?
半監(jiān)督學(xué)習:比監(jiān)督學(xué)習做的更好
深度學(xué)習:基于語境的文本分類弱監(jiān)督學(xué)習
機器學(xué)習中的無監(jiān)督學(xué)習應(yīng)用在哪些領(lǐng)域
自監(jiān)督學(xué)習的一些思考
融合零樣本學(xué)習和小樣本學(xué)習的弱監(jiān)督學(xué)習方法綜述

實現(xiàn)強監(jiān)督和弱監(jiān)督學(xué)習網(wǎng)絡(luò)的協(xié)同增強學(xué)習
評論