亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CNN結(jié)構(gòu)基本情況

新機(jī)器視覺 ? 來源:人工智能感知信息處理算 ? 作者:人工智能感知信息 ? 2022-07-05 11:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學(xué)習(xí)機(jī)器學(xué)習(xí)算法研究中新開辟的研究方向,在圖像領(lǐng)域的應(yīng)用是最開始的嘗試。近年以來,計算機(jī)視覺領(lǐng)域和 CNN 網(wǎng)絡(luò)結(jié)構(gòu)的不斷更新發(fā)展,出現(xiàn)了一批代表性的深度卷積神經(jīng)網(wǎng)絡(luò)。本章節(jié)主要介紹目標(biāo)檢測算法 YOLO 系列借鑒了設(shè)計思想的這些框架,分別是:Le Net、Alex Net、VGG、Goog Le Net和 Res Net。表 1 所示,介紹了代表性的 CNN 結(jié)構(gòu)基本情況。

a240625c-fc14-11ec-ba43-dac502259ad0.png

1 LeNet

LeNet 卷積神經(jīng)網(wǎng)絡(luò)是由深度學(xué)習(xí)三巨頭之一的 Yan Le Cun于 1994 年提出來的。其對構(gòu)建的 MNIST手寫字符數(shù)據(jù)集進(jìn)行分類。LeNet 的提出確立了 CNN 的基本網(wǎng)絡(luò)架構(gòu)。如下圖所示,Le Net 通過輸入32 ×32 字符矩陣經(jīng)過卷積層、下采樣層、全連接層進(jìn)行圖像的分類識別。但因為當(dāng)時硬件技術(shù)的局限性和訓(xùn)練數(shù)據(jù)的不豐富性,Le Net 模型的運(yùn)算效果并不是特別突出,但此特征網(wǎng)絡(luò)的提出,為后續(xù) Alex Net 的出現(xiàn)提供了重要的參考。

a2548bce-fc14-11ec-ba43-dac502259ad0.png

2 Alex Net

Alex Net的出現(xiàn),標(biāo)志著深度卷積神經(jīng)網(wǎng)絡(luò)開啟了創(chuàng)新的新時代。之前由于硬件技術(shù)的局限性,CNN的學(xué)習(xí)能力、圖像分類能力有限,而在 2012 年提出的卷積神經(jīng)網(wǎng)絡(luò) Alex Net 采用了兩個 GPU(NVIDIA GTX 580)來訓(xùn)練模型,然后將兩個 GPU 上的特征圖進(jìn)行合并,采用的數(shù)據(jù)集是 Image Net(1500 多萬個標(biāo)記的圖像,2.2萬個類別),并在2012 ILSVRC大賽以優(yōu)異的性能在計算機(jī)視覺領(lǐng)域展現(xiàn)了自己的實力。如圖下圖所示,Alex Net 的網(wǎng)絡(luò)結(jié)構(gòu)包括 5 層卷積、3 層池化和 3 層全連接,特征提取能力得到了提高,對大規(guī)模的數(shù)據(jù)集有更好的擬合能力。并且,在訓(xùn)練階段,通過在模型隨機(jī)的添加幾個轉(zhuǎn)換單元來確保網(wǎng)絡(luò)具有較好的魯棒性。其結(jié)構(gòu)創(chuàng)新的要點為:

(1)使用 Re LU 作為非線性激活函數(shù),減少梯度消失現(xiàn)象,提高收斂率,減少訓(xùn)練時間。

(2)使用大尺寸卷積核(5×5和11×11),提高網(wǎng)絡(luò)感受野。 (3)加入 Drop Out 層抑制過擬合。 (4)使用數(shù)據(jù)增強(qiáng)技術(shù),對圖像進(jìn)行訓(xùn)練時,隨機(jī)的添加平移縮放、裁剪旋轉(zhuǎn)、翻轉(zhuǎn)或增減亮度等操作,產(chǎn)生一系列和輸入圖像相似但又不相同的數(shù)據(jù),從而擴(kuò)充了訓(xùn)練的數(shù)據(jù)集。

a29573b4-fc14-11ec-ba43-dac502259ad0.png

3 VGG

VGG(Visual Geometry Group)多層網(wǎng)絡(luò)模型,比 Alex Net 和 Zef Net 的深度多了 19 層,驗證了在網(wǎng)絡(luò)結(jié)構(gòu)上增加深度可以直接影響模型性能。VGG 有兩種結(jié)構(gòu),分為 VGG16 和 VGG19,這二者的區(qū)別只在于網(wǎng)路深度不同。VGG 的設(shè)計思想是增加網(wǎng)絡(luò)深度,改用小尺寸的卷積核。如下圖所示,具體操作為:采用 3 個3×3 卷積核來替換 Alex Net 中的 7×7 卷積核,采用 2 個3×3 卷積核替換5×5卷積核,這樣的設(shè)計可以在保證具有相同感受野的前提下,增加網(wǎng)絡(luò)深度,提升模型效果,且改用小的3×3 Filters 可減少模型參數(shù)量和運(yùn)算量,可以更好地保留圖像特征信息。具體的改進(jìn)優(yōu)點總結(jié)為以下幾點:

(1)采用3×3 小濾波器替換大尺寸卷積核

(2)替換卷積核后,卷積層的感受野相同

(3)每層卷積操作后通過 Re LU 激活函數(shù)和批處理梯度下降訓(xùn)練

(4)驗證了增加網(wǎng)絡(luò)深度,可以提升模型性能 雖然,VGG 在 2014 年因其更深的網(wǎng)絡(luò)結(jié)構(gòu)和計算低復(fù)雜度的優(yōu)勢,使其在圖像分類和定位問題上取得了很好地成績,但它使用了 1.4 億個參數(shù),計算量很大,這是它的不足之處。

a2b9b706-fc14-11ec-ba43-dac502259ad0.png

4 Goog Le Net

Goog Le Net是由 Google 提出的,獲得了 Image Net 大賽冠軍。其架構(gòu)設(shè)計的核心是在保證高水準(zhǔn)的精確性 Inception 的目標(biāo)前提下,降低模型的計算成本。與 VGG 相比,Goog Le Net 是一個網(wǎng)絡(luò)深度為 22 層的卷積神經(jīng)網(wǎng)絡(luò),它不以傳統(tǒng) CNN 卷積層的串聯(lián)堆疊為架構(gòu)基礎(chǔ),而是創(chuàng)新的提出了 Inception 結(jié)構(gòu),用NIN(Networkin-Network)替換普通卷積層。如下圖所示,該結(jié)構(gòu)包含了 5×5 、 3×3 、1×1 濾波器,以便于在不同空間分辨率范圍內(nèi)捕捉通道信息和空間特征,添加一個1×1濾波器,作為 Bottle Neck ,來提高網(wǎng)絡(luò)的效率,提升模型學(xué)習(xí)特征的能力。使用平均池化層代替全連接層,將 7×7×1024 的體積降到了 1×1×1024 ,減少了大量的參數(shù)。此外,Goog Le Net 還提出了輔助分類器 Soft Max,以加快收斂速度。但 Goog Le Net 也有短板,其表征堵塞會減少下一層的特征空間,反過來又可能會丟失有用的特征。

a2e83680-fc14-11ec-ba43-dac502259ad0.png

5 Res Net

Res Net(Residual Network)殘差網(wǎng)絡(luò)是 Kaiming He提出來的,并在 2015 ILSVRC 大賽以 3.57%的錯誤率獲得了冠軍。在之前的網(wǎng)絡(luò)中,當(dāng)模型深度不夠,其網(wǎng)絡(luò)識別能力不強(qiáng),但當(dāng)網(wǎng)絡(luò)堆疊(Plain Network)很深的時候,網(wǎng)絡(luò)梯度消失和梯度彌散現(xiàn)象明顯,導(dǎo)致模型的運(yùn)算效果卻不升反降。因此,鑒于此深層網(wǎng)絡(luò)的退化問題,Res Net 設(shè)計了一個不存在梯度消失問題的超深度網(wǎng)絡(luò)。Res Net 根據(jù)層數(shù)的不同,從 18 層到 1202 層,有多種類型。以 Res Net50 為例,它由 49 個卷積層和 1 個全連接層組成,如下圖所示。這種簡單的加法并不會給網(wǎng)絡(luò)增加額外的參數(shù)和計算量,同時卻可以大大增加模型的訓(xùn)練速度、提高訓(xùn)練效果,并且當(dāng)模型的層數(shù)加深時,這個簡單的結(jié)構(gòu)能夠很好的解決退化問題。Res Net 提出了短徑連接,當(dāng)網(wǎng)絡(luò)性能已達(dá)到最優(yōu),繼續(xù)加深網(wǎng)絡(luò),殘差映射將被設(shè)置為 0,只剩下恒等映射,加速網(wǎng)絡(luò)收斂,這樣就可以使得網(wǎng)絡(luò)一直處于最優(yōu)狀態(tài)了,網(wǎng)絡(luò)的性能也就不會隨著深度增加而降低了。

a319b21e-fc14-11ec-ba43-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:圖像分類模型的發(fā)展

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    CNN卷積神經(jīng)網(wǎng)絡(luò)設(shè)計原理及在MCU200T上仿真測試

    CNN算法簡介 我們硬件加速器的模型為Lenet-5的變型,網(wǎng)絡(luò)粗略分共有7層,細(xì)分共有13層。包括卷積,最大池化層,激活層,扁平層,全連接層。下面是各層作用介紹: 卷積層:提取特征。“不全
    發(fā)表于 10-29 07:49

    構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議

    通過實踐,本文總結(jié)了構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議,這些建議將會在構(gòu)建高準(zhǔn)確率輕量級CNN神經(jīng)網(wǎng)絡(luò)模型方面提供幫助。 1)避免單層神經(jīng)網(wǎng)絡(luò):我們清楚神經(jīng)網(wǎng)絡(luò)本身是需要不斷抽象出更高級別的紋理
    發(fā)表于 10-28 08:02

    淘寶圖片搜索接口開發(fā)實戰(zhàn):從 CNN 特征提取到商品匹配(附避坑手冊 + 可復(fù)用代碼)

    本文詳解淘寶圖片搜索接口開發(fā)全流程,涵蓋CNN特征提取、商品匹配、參數(shù)配置及400/429等高頻報錯解決方案,附合規(guī)避坑指南與可復(fù)用代碼,助你高效實現(xiàn)圖像搜商品功能。
    的頭像 發(fā)表于 10-21 10:03 ?162次閱讀

    定義IO初始化結(jié)構(gòu)

    由上述IOPORT相關(guān)功能的枚舉類型我們可以知道,在對IOPORT模塊進(jìn)行初始化時需要根據(jù)情況配置它們。因此我們定義一個IOPORT初始化的結(jié)構(gòu)體類型IOPORT_Init_t,它的成員包括了由上述所有枚舉類型所聲明的變量,因此該結(jié)構(gòu)
    的頭像 發(fā)表于 07-16 16:26 ?1020次閱讀

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進(jìn)行深度學(xué)習(xí)實踐,并盡量實現(xiàn)皮膚病理圖片的識別,第四階段

    接第三階段,上次說道要將cnn這個模塊接入到高云自帶的視頻實例里面,于是就開始學(xué)習(xí)和了解這個實例里面的每個模塊的功能,后來發(fā)現(xiàn),除了要看一下高云自己的ip文檔外,還要看很多視頻處理相關(guān)的協(xié)議文檔
    發(fā)表于 07-12 07:58

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進(jìn)行深度學(xué)習(xí)實踐,并盡量實現(xiàn)皮膚病理圖片的識別,第三階段

    接上回,這次說一說第三階段的進(jìn)展,一直在想如何將cnn融合進(jìn)高云以后的視頻案例里面,比如:下圖 上面圖中文件之間的關(guān)系應(yīng)該是這樣的: 一、 完整的視頻數(shù)據(jù)處理流程 根據(jù)這些文件名,我們可以清晰地勾勒
    發(fā)表于 07-06 15:18

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進(jìn)行深度學(xué)習(xí)實踐,并盡量實現(xiàn)皮膚病理圖片的識別,第二階段

    接上次的想法,糾結(jié)在繼續(xù)用CNN還是yolo的時候,隨著對這方面資料的不斷了解,發(fā)現(xiàn)還是CNN這個結(jié)構(gòu)比較基礎(chǔ),yolo要做的工作非常多,而且要求比較高,時間會比較長。 于是我就借助B站平臺,跟著子
    發(fā)表于 06-23 18:37

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進(jìn)行深度學(xué)習(xí)實踐,并盡量實現(xiàn)皮膚病理圖片的識別

    。 `clahe.py 但是上面的代碼和相關(guān)的邏輯暫時就停在這里了。 后來又過了幾天,嘗試一些有關(guān)cnn的實現(xiàn)。 記得在綜合的時候要將這個文件里面的模塊名替換一下: 上面雖然綜合通過,但是還有一些警告。后面有時間的話
    發(fā)表于 06-11 22:35

    OCAD應(yīng)用:單透鏡與雙膠合透鏡結(jié)構(gòu)組合設(shè)計

    n之間的對應(yīng)關(guān)系。 有些系統(tǒng)因外形尺寸或像差分配要求的原因,一個單獨的單透鏡或雙膠合透鏡無法滿足要求,必須進(jìn)一步對結(jié)構(gòu)要做復(fù)雜化處理,必須使用多透鏡組合。在這種情況下由一個單透鏡和一個雙膠合透鏡的組合
    發(fā)表于 06-06 08:55

    開關(guān)電源拓?fù)?b class='flag-5'>結(jié)構(gòu)介紹

    PUSH-PULL 推挽電路HALF BRIDGE 半橋電路FULL BRIDGE 全橋電路SEPIC 電路 二、拓?fù)?b class='flag-5'>結(jié)構(gòu)介紹(一)BUCK 降壓電路 在不考慮帶有寄生參數(shù)的RLGC模型的情況下,一般我們的計算步驟
    發(fā)表于 05-12 16:04

    銀河電氣功率分析儀的基本情況及如何搭配合適的傳感器

    湖南銀河電氣WP4000變頻功率分析儀是一款適用于變壓器、整流器、逆變器、變頻器等各類變流器及電機(jī)、電器產(chǎn)品的檢試驗、能效評測及諧波分析的寬頻帶、高精度功率分析儀,是電力電子技術(shù)、變頻調(diào)速技術(shù)和新能源技術(shù)高速發(fā)展的必然產(chǎn)物和健康持續(xù)發(fā)展的重要基礎(chǔ)儀器。 相比傳統(tǒng)功率表,功率分析儀具備以下特性: 寬頻帶與高精度:支持從直流到兆赫茲級的信號測量,精度可達(dá)0.05%級別(例如Hioki等品牌的高端型號)。 多參數(shù)分析:除基本電參數(shù)
    的頭像 發(fā)表于 02-21 18:13 ?673次閱讀
    銀河電氣功率分析儀的<b class='flag-5'>基本情況</b>及如何搭配合適的傳感器

    二維周期光柵結(jié)構(gòu)(菱形)光波導(dǎo)的應(yīng)用

    : ?周期:400納米 ?z方向延伸(沿z軸的調(diào)制深度):400nm ?填充系數(shù)(非平行情況下底部或頂部):50% ?傾斜角度:40o 總結(jié)—元件 具有非正交二維周期的菱形(菱形)光柵結(jié)構(gòu),通過定制接口
    發(fā)表于 01-23 10:37

    菱形石墨烯結(jié)構(gòu)及其中的量子反常霍爾效應(yīng)

    霍爾效應(yīng)(QAH)作為一個特別引人注目的課題,有望在無耗散電子學(xué)中帶來革命性的應(yīng)用。 量子反?;魻栃?yīng) QAH效應(yīng)是一種量子力學(xué)現(xiàn)象,其特征是在沒有外加磁場的情況下霍爾電阻的量子化。這種量子化源于電子能帶結(jié)構(gòu)的拓?fù)湫再|(zhì)
    的頭像 發(fā)表于 12-06 09:52 ?940次閱讀

    藍(lán)牙信道探測技術(shù)或改變UWB市場格局

    不久前,我們介紹了藍(lán)牙6.0的基本情況,其中最為驚喜的是新增了 藍(lán)牙信道探測(Bluetooth Channel Sounding) 。新技術(shù)的入場會對原本的市場格局帶來哪些變化?通過拆解技術(shù)原理或許能夠窺見一二。
    的頭像 發(fā)表于 11-22 10:22 ?913次閱讀

    無刷電機(jī)方波驅(qū)動原理分析

    通過前幾期芝識課堂的學(xué)習(xí),相信大家已經(jīng)熟練掌握了電機(jī)的各種基本情況和工作模式,大家也該躍躍欲試希望能進(jìn)入實戰(zhàn)動手環(huán)節(jié)了,準(zhǔn)備好操作電機(jī)的所有前期準(zhǔn)備,讓我們一起讓無刷電機(jī)真正工作起來吧!
    的頭像 發(fā)表于 11-21 18:12 ?2573次閱讀
    無刷電機(jī)方波驅(qū)動原理分析