谷歌AI研究部門華人科學(xué)家再發(fā)論文《EfficientNet:重新思考CNN模型縮放》,模型縮放的傳統(tǒng)做法是任意增加CNN的深度和寬度,或使用更大的輸入圖像分辨率進(jìn)行訓(xùn)練,而使用EfficientNet使用一組固定額縮放系數(shù)統(tǒng)一縮放每個維度,超越了當(dāng)先最先進(jìn)圖像識別網(wǎng)絡(luò)的準(zhǔn)確率,效率提高了10倍,而且更小。
目前提高CNN精度的方法,主要是通過任意增加CNN深度或?qū)挾?,或使用更大的輸入圖像分辨率進(jìn)行訓(xùn)練和評估。
以固定的資源成本開發(fā),然后按比例放大,以便在獲得更多資源時實(shí)現(xiàn)更好的準(zhǔn)確性。例如ResNet可以通過增加層數(shù)從ResNet-18擴(kuò)展到ResNet-200。
	
再比如開源大規(guī)模神經(jīng)網(wǎng)絡(luò)模型高效訓(xùn)練庫GPipe,通過將基線CNN擴(kuò)展四倍來實(shí)現(xiàn)84.3% ImageNet top-1精度。
這種方法的優(yōu)勢在于確實(shí)可以提高精度,但劣勢也很明顯。這個時候往往需要進(jìn)行繁瑣的微調(diào)。一點(diǎn)點(diǎn)的摸黑去試、還經(jīng)常的徒勞無功。這絕對不是一件能夠讓人身心愉快的事情,對于谷歌科學(xué)家們也一樣。
這就是為什么,谷歌人工智能研究部門的科學(xué)家們正在研究一種新的“更結(jié)構(gòu)化”的方式,來“擴(kuò)展”卷積神經(jīng)網(wǎng)絡(luò)。他們給這個新的網(wǎng)絡(luò)命名為:EfficientNet(效率網(wǎng)絡(luò))。
代碼已開源,論文剛剛上線arXiv,并將在6月11日,作為poster亮相ICML 2019。
比現(xiàn)有卷積網(wǎng)絡(luò)小84倍,比GPipe快6.1倍
為了理解擴(kuò)展網(wǎng)絡(luò)的效果,谷歌的科學(xué)家系統(tǒng)地研究了縮放模型不同維度的影響。模型縮放并確定仔細(xì)平衡網(wǎng)絡(luò)深度后,發(fā)現(xiàn)只要對網(wǎng)絡(luò)的深度、寬度和分辨率進(jìn)行合理地平衡,就能帶來更好的性能?;谶@一觀察,科學(xué)家提出了一種新的縮放方法,使用簡單但高效的復(fù)合系數(shù)均勻地縮放深度、寬度和分辨率的所有尺寸。
據(jù)悉,EfficientNet-B7在ImageNet上實(shí)現(xiàn)了最先進(jìn)精度的84.4% Top 1/97.1% Top 5,同時比最好的現(xiàn)有ConvNet小84倍,推理速度快6.1倍;在CIFAR-100(91.7%),F(xiàn)lower(98.8%)和其他3個遷移學(xué)習(xí)數(shù)據(jù)集上,也能很好地傳輸和實(shí)現(xiàn)最先進(jìn)的精度。參數(shù)減少一個數(shù)量級,效率卻提高了10倍(更小,更快)。
	
與流行的ResNet-50相比,另一款EfficientNet-B4使用了類似的FLOPS,同時將ResNet-50的最高精度從76.3%提高到82.6%。
這么優(yōu)秀的成績是如何做到的
這種復(fù)合縮放方法的第一步是執(zhí)行網(wǎng)格搜索,在固定資源約束下找到基線網(wǎng)絡(luò)的不同縮放維度之間的關(guān)系(例如,2倍FLOPS),這樣做的目的是為了找出每個維度的適當(dāng)縮放系數(shù)。然后應(yīng)用這些系數(shù),將基線網(wǎng)絡(luò)擴(kuò)展到所需的目標(biāo)模型大小或算力預(yù)算。
	
與傳統(tǒng)的縮放方法相比,這種復(fù)合縮放方法可以持續(xù)提高擴(kuò)展模型的準(zhǔn)確性和效率,和傳統(tǒng)方法對比結(jié)果:MobileNet(+ 1.4% imagenet精度),ResNet(+ 0.7%)。
新模型縮放的有效性,很大程度上也依賴基線網(wǎng)絡(luò)。
為了進(jìn)一步提高性能,研究團(tuán)隊還通過使用AutoML MNAS框架執(zhí)行神經(jīng)架構(gòu)搜索來開發(fā)新的基線網(wǎng)絡(luò),該框架優(yōu)化了準(zhǔn)確性和效率(FLOPS)。
由此產(chǎn)生的架構(gòu)使用移動倒置瓶頸卷積(MBConv),類似于MobileNetV2和MnasNet,但由于FLOP預(yù)算增加而略大。然后,通過擴(kuò)展基線網(wǎng)絡(luò)以獲得一系列模型,被稱為EfficientNets。
	
不僅局限于ImageNet
EfficientNets在ImageNet上的良好表現(xiàn),讓谷歌的科學(xué)家希望將其應(yīng)用于更廣泛的網(wǎng)絡(luò)中,造福更多的人。
在8個廣泛使用的遷移學(xué)習(xí)數(shù)據(jù)集上測試之后,EfficientNet在其中的5個網(wǎng)絡(luò)實(shí)現(xiàn)了最先進(jìn)的精度。例如,在參數(shù)減少21倍的情況下,實(shí)現(xiàn)了CIFAR-100(91.7%)和Flowers(98.8%)。
看到這樣的結(jié)果,谷歌科學(xué)家預(yù)計EfficientNet可能成為未來計算機(jī)視覺任務(wù)的新基礎(chǔ),因此將EfficientNet開源。
華人做出了重要貢獻(xiàn)
論文的兩位作者,都和中國有關(guān)。
第一作者是谷歌的高級軟件工程師Mingming Tan,北大博士,在康奈爾大學(xué)獲得博士后學(xué)位。
第二作者Quoc V. Le現(xiàn)在是谷歌的一名軟件工程師,在斯坦福獲得博士學(xué)位,師從著名的人工智能領(lǐng)袖吳恩達(dá)。
他在越南農(nóng)村長大,會英語、普通話、吳語和廣東話。小時候家里連電都沒有。但他住的地方附近有一個圖書館。Le在圖書館里,如饑似渴的閱讀那些偉大發(fā)明,小小年紀(jì)便夢想有朝一日自己的名字,也能銘刻在人類偉大發(fā)明家名人堂上。
14歲的時候,他就幻想一個足夠聰明的機(jī)器能夠幫助人類。這個幻想讓他走上了人工智能的道路。
- 
                                谷歌
                                +關(guān)注
關(guān)注
27文章
6241瀏覽量
110081 - 
                                卷積網(wǎng)絡(luò)
                                +關(guān)注
關(guān)注
0文章
43瀏覽量
3125 
原文標(biāo)題:谷歌出品EfficientNet:比現(xiàn)有卷積網(wǎng)絡(luò)小84倍,比GPipe快6.1倍
文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
一些神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計優(yōu)化方案
CNN卷積神經(jīng)網(wǎng)絡(luò)設(shè)計原理及在MCU200T上仿真測試
谷歌芯片實(shí)現(xiàn)量子計算新突破,比超算快13000倍
今日看點(diǎn):谷歌芯片實(shí)現(xiàn)量子計算比經(jīng)典超算快13000倍;NFC 技術(shù)突破:讀取距離從 5 毫米提升至 20 毫米
    華為助力埃塞俄比亞電信通信網(wǎng)絡(luò)技術(shù)邁向新高度
電源抑制比
如何使用MATLAB實(shí)現(xiàn)一維時間卷積網(wǎng)絡(luò)
    
          
        
        
效率網(wǎng)絡(luò):比現(xiàn)有卷積網(wǎng)絡(luò)小84倍,比GPipe快6.1倍
                
 
           
            
            
                
            
評論