亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)在各種計(jì)算機(jī)視覺任務(wù)上都取得了重大的突破

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 作者:新機(jī)器視覺 ? 2021-04-18 10:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

智源導(dǎo)讀:近年來,深度學(xué)習(xí)在各種計(jì)算機(jī)視覺任務(wù)上都取得了重大的突破,其中一個(gè)重要因素就是其強(qiáng)大的非線性表示能力,能夠理解圖像更深層次的信息。本文針對(duì)CV+Deep Learning未來的走向進(jìn)行了展望,其中包括CV與Learning之間的關(guān)系、CV面向不同場(chǎng)景以及Learning面向不同場(chǎng)景等多方面的延展。

01

「Learning-based CV」to 「CV-based Learning」

得益于神經(jīng)網(wǎng)絡(luò)較強(qiáng)的學(xué)習(xí)能力,很多視覺任務(wù)都被丟入一個(gè)黑盒中,然而神經(jīng)網(wǎng)絡(luò)直接從像素上對(duì)場(chǎng)景進(jìn)行感知是不夠的。對(duì)于具體的任務(wù),我們需要利用CV中的原理和技術(shù)點(diǎn)對(duì)其進(jìn)行解剖和建模,然后再利用深度學(xué)習(xí)中的網(wǎng)絡(luò)架構(gòu)/工具進(jìn)行相應(yīng)的特征提取與任務(wù)決策。
這里舉個(gè)例子,CV中有一個(gè)很具有挑戰(zhàn)性的任務(wù)是3D from Monocular Vision,即從單目圖像進(jìn)行三維重建與感知。目前很多方案都是通過強(qiáng)監(jiān)督學(xué)習(xí)方式直接對(duì)深度信息進(jìn)行預(yù)測(cè)或者直接在2D圖像上進(jìn)行3D任務(wù)。 在計(jì)算機(jī)視覺中,我們知道,從三維世界坐標(biāo)系到二維相機(jī)坐標(biāo)系是經(jīng)過了一個(gè)透視變換的,因此不同深度的物體才被投影到了同一個(gè)平面上(如圖1所示)。如果利用這種變換關(guān)系去顯示地指導(dǎo)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)或者利用可逆網(wǎng)絡(luò)去學(xué)習(xí)這種變換關(guān)系,會(huì)更加貼合真實(shí)場(chǎng)景中的應(yīng)用。如Marr Vision所描述的,對(duì)于一個(gè)圖像/場(chǎng)景的感知需要經(jīng)過"2D-2.5D-3D"的過程,然而在Learning-based CV中,諸如此類的視覺原理都被簡(jiǎn)單粗暴的2D Convolutional Kernel給卷掉了。因此,CV + Deep Learning整個(gè)體系的后續(xù)發(fā)展應(yīng)該會(huì)從Learning-based CV轉(zhuǎn)到CV-based Learning,對(duì)于不同的視覺任務(wù)融入相應(yīng)的CV原理并建模Learning方式。

a34068ac-9fbb-11eb-8b86-12bb97331649.png

圖1:Ideal Projection of a 3D Object on A 2D Image

02

「Clean CV」to「Wild CV」

目前熱門的視覺任務(wù)如目標(biāo)檢測(cè)、語義分割、深度估計(jì)等都已被“卷er”們刷爆各大榜單,其中所用到的大多數(shù)數(shù)據(jù)集都是非常干凈的。然而在真實(shí)場(chǎng)景中,常見的噪聲如徑向畸變、光照、運(yùn)動(dòng)模糊、雨霧等都會(huì)通過改變物體的紋理結(jié)構(gòu)而改變其語義特征,因此造成算法的泛化性不強(qiáng)、換個(gè)數(shù)據(jù)集就崩的現(xiàn)象。一個(gè)很直接的解決方案是Image Restoration + CV Task,即在做具體CV任務(wù)之前直接還原一個(gè)干凈的場(chǎng)景。但是有一點(diǎn)需要注意的是目前Image Restoration很多都是基于圖像生成式,在去噪的過程中常常會(huì)引入新的圖像信息,這種顧此失彼的操作對(duì)很多下游任務(wù)是不能接受的。 對(duì)人來說,我們的日常視覺任務(wù)很少經(jīng)過Image Restoration這一步,而是直接在存在各種噪聲的情況下進(jìn)行感知與決策。其中一個(gè)最主要的原因是我們已經(jīng)見過各種場(chǎng)景下的相同物體,即人通過視覺系統(tǒng)所提取到的特征對(duì)于噪聲具備較好的不變性。相比之下,目前Clean CV所做的事情可能更多關(guān)注的是提取對(duì)具體任務(wù)有幫助的特征,而這種Feature Bias會(huì)影響算法的泛化功能。

03

「Single-Frame CV」to「Sequence CV」

Video Understanding是一個(gè)未來可期的方向,近些年興起的“小視頻”等新消遣方式大大增加了該方向的人才需求,一些大廠如阿里、騰訊等也在悄然布局。先拋開工業(yè)界需求不說,來聊一些具體的技術(shù)點(diǎn)。 視頻相較于圖像而言具有一個(gè)絕佳的優(yōu)勢(shì)——時(shí)序性。這一優(yōu)勢(shì)產(chǎn)生的前后幀相關(guān)性能夠促使弱監(jiān)督學(xué)習(xí)和自監(jiān)督學(xué)習(xí)等得以更好地應(yīng)用,人類也是在這樣一個(gè)動(dòng)態(tài)的世界里利用僅有的標(biāo)簽信息不斷地學(xué)習(xí)與認(rèn)知。同時(shí),在Sequence CV中,F(xiàn)rame之間的“遷移學(xué)習(xí)”也是值得探索的,即如何利用少量前序幀中學(xué)習(xí)到的知識(shí)去啟發(fā)大量的后序幀。對(duì)于視頻的海量數(shù)據(jù)對(duì)顯卡資源產(chǎn)生的負(fù)擔(dān),視頻濃縮(Video Synopsis)等技術(shù)可能會(huì)帶來新的突破。

a392f180-9fbb-11eb-8b86-12bb97331649.png

圖2:Video Synopsis

04

「General Pre-training CV」to「Specific Pre-training CV」

眾所周知,Pre-training on ImageNet在CV中是一個(gè)通用且有效的策略。但是,一些工作表明這種策略對(duì)不同CV任務(wù)的作用是不同的,原因大致有兩點(diǎn):Data Gap和Task Gap。首先在ImageNet數(shù)據(jù)集中,大多數(shù)圖片都是無噪聲的,并且場(chǎng)景較為單一,前景、背景易于剝離,這與其他不同的數(shù)據(jù)集存在數(shù)據(jù)上的差異;其次,ImageNet所面向的主要任務(wù)是圖像分類,所以預(yù)載入模型中的參數(shù)大多與益于分類的特征相關(guān),對(duì)于一些位置信息要求更加精細(xì)的任務(wù)卻啟發(fā)有限。 那么我們?nèi)绾螌W(xué)習(xí)一個(gè)更好的Prior去啟發(fā)后續(xù)視覺任務(wù)呢?再來聯(lián)系一下人類的學(xué)習(xí)過程,對(duì)于不同的任務(wù)/課程,我們是有特定的Warm-up階段。比如在學(xué)習(xí)乒乓球和籃球的過程中,對(duì)于乒乓球一開始我們需要練習(xí)的是簡(jiǎn)單的推擋和發(fā)球動(dòng)作,而對(duì)于籃球,我們則是在一開始練習(xí)基礎(chǔ)的運(yùn)球和投籃動(dòng)作,這兩個(gè)Pre-training顯然是不同的。回到CV中,對(duì)于不同任務(wù)比如深度估計(jì)和語義分割,也應(yīng)該給予不同且更加精細(xì)的預(yù)學(xué)習(xí)課程:深度估計(jì)——三維成像先驗(yàn),語義分割——場(chǎng)景類別先驗(yàn)等。

a45c3f40-9fbb-11eb-8b86-12bb97331649.png

圖3:Pre-training on ImageNet

05

「Learning-ImplicitCV」to「Learning-Friendly CV」

如何評(píng)價(jià)一個(gè)任務(wù)是否易于網(wǎng)絡(luò)學(xué)習(xí),或者說這個(gè)任務(wù)是否對(duì)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)友好?很直觀的一點(diǎn)就是去看圖像特征與學(xué)習(xí)目標(biāo)之間有無顯示關(guān)聯(lián)。例如在目標(biāo)檢測(cè)中,圖像特征與Bounding Box之間的關(guān)聯(lián)是肉眼可見的。而對(duì)于另一些任務(wù),例如從一幅圖像中直接預(yù)測(cè)對(duì)應(yīng)拍攝相機(jī)的相機(jī)參數(shù),那么圖像特征與相機(jī)參數(shù)之間的關(guān)聯(lián)就顯得格外隱式了。此外,學(xué)習(xí)目標(biāo)的同質(zhì)性(Homogeneity)和異質(zhì)性(Heterogeneity)也會(huì)影響神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)。如果對(duì)相機(jī)參數(shù)進(jìn)一步細(xì)化的話,我們可以發(fā)現(xiàn)其中還包含了相機(jī)光心、焦距、畸變參數(shù)等不同的參數(shù),這些參數(shù)之間的異質(zhì)性以及相差甚遠(yuǎn)的取值范圍會(huì)很容易導(dǎo)致回歸的不平衡問題。 相比之下,Bounding Box中均為描述位置信息的頂點(diǎn)且取值范圍相近,那么我們就可以說學(xué)習(xí)Bounding Box對(duì)神經(jīng)網(wǎng)絡(luò)是友好的。后續(xù)的Center-based目標(biāo)檢測(cè)又進(jìn)一步優(yōu)化了所學(xué)習(xí)的目標(biāo)表示。從顯示性與同質(zhì)性這兩點(diǎn)出發(fā),我個(gè)人在學(xué)習(xí)相機(jī)參數(shù)這一個(gè)小點(diǎn)上提出了一個(gè)Learning-Friendly Representation(如下圖所示),去代替?zhèn)鹘y(tǒng)的隱式和異質(zhì)的相機(jī)參數(shù),具體細(xì)節(jié)可參考論文A Deep Ordinal Distortion Estimation Approach for Distortion Rectification (IEEE TIP 2021)。除了相機(jī)參數(shù),CV中還存在很多對(duì)神經(jīng)網(wǎng)絡(luò)并不是很友好的學(xué)習(xí)目標(biāo),相信后續(xù)工作會(huì)做好CV與神經(jīng)網(wǎng)絡(luò)之間的Trade-off,不會(huì)讓神經(jīng)網(wǎng)絡(luò)太過為難。

a4a1a436-9fbb-11eb-8b86-12bb97331649.png

圖4:A Learning-friendly Representation for the Camera Intrinsic Parameters 綜上,近年CV + Deep Learning雖在眾多任務(wù)上得以革新,但二者相互作用的關(guān)系仍需要根據(jù)不同任務(wù)進(jìn)行省視,而且面向Wild、Dynamic、Specific、Learning-Friendly等場(chǎng)景的進(jìn)階之路道阻且長。 作者簡(jiǎn)介:廖康,北京交通大學(xué)信息科學(xué)研究所2018級(jí)博士生,師從林春雨教授,讀博期間主要從事圖像生成、圖像修復(fù)、3D視覺等研究,相關(guān)成果發(fā)表至IEEE Transactions on Image Processing (TIP), IEEE Conference on Computer Vision and Pattern Recognition (CVPR), IEEE Transactions on Intelligent Transportation Systems (TITS), IEEE Transactions on Circuits and Systems for Video Technology (TCSVT)等會(huì)議及期刊。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:計(jì)算機(jī)視覺未來走向:視頻理解等5大趨勢(shì)詳解

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí),這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動(dòng)化)帶來的潛力,因?yàn)?b class='flag-5'>深度學(xué)習(xí)并非只屬于
    的頭像 發(fā)表于 09-10 17:38 ?592次閱讀
    如何在機(jī)器<b class='flag-5'>視覺</b>中部署<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    自動(dòng)化計(jì)算機(jī)的功能與用途

    工業(yè)自動(dòng)化是指利用自動(dòng)化計(jì)算機(jī)來控制工業(yè)環(huán)境中的流程、機(jī)器人和機(jī)械,以制造產(chǎn)品或其部件。工業(yè)自動(dòng)化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動(dòng)化汽車制造中體現(xiàn)得最為明顯,其中許多任務(wù)
    的頭像 發(fā)表于 07-15 16:32 ?429次閱讀
    自動(dòng)化<b class='flag-5'>計(jì)算機(jī)</b>的功能與用途

    中軟國際能源化工行業(yè)大模型項(xiàng)目取得重大突破

    近日,中軟國際簽約某大型石油企業(yè)大模型開發(fā)項(xiàng)目。作為中國能源化工行業(yè)首個(gè)備案的大模型,此次簽約標(biāo)志著中軟國際能源化工行業(yè)人工智能領(lǐng)域取得了重大突破。根據(jù)項(xiàng)目規(guī)劃,中軟國際將針對(duì)輸送管質(zhì)量檢測(cè)、常減壓工藝運(yùn)行優(yōu)化、設(shè)備預(yù)測(cè)性維護(hù)
    的頭像 發(fā)表于 07-05 17:03 ?1107次閱讀

    NVIDIA驅(qū)動(dòng)的現(xiàn)代超級(jí)計(jì)算機(jī)如何突破速度極限并推動(dòng)科學(xué)發(fā)展

    現(xiàn)代高性能計(jì)算不僅使得更快的計(jì)算成為可能,它正驅(qū)動(dòng)著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學(xué)突破。 高性能計(jì)算經(jīng)歷了多次迭代,每一次源于對(duì)技術(shù)的創(chuàng)造
    的頭像 發(fā)表于 06-26 19:39 ?864次閱讀
    NVIDIA驅(qū)動(dòng)的現(xiàn)代超級(jí)<b class='flag-5'>計(jì)算機(jī)</b>如何<b class='flag-5'>突破</b>速度極限并推動(dòng)科學(xué)發(fā)展

    CADENAS 2025 年金字塔公司聯(lián)系博覽會(huì)上取得圓滿成功

    上展示了目前的招聘信息,很多人都很樂意將這些信息帶走。如果您想了解更多信息,也可以我們的職業(yè)網(wǎng)頁找到所有信息。 無論是學(xué)習(xí)商業(yè)信息學(xué)、建筑學(xué)、計(jì)算機(jī)科學(xué)還是國際管理等專業(yè)的學(xué)生,
    發(fā)表于 06-04 14:32

    利用邊緣計(jì)算和工業(yè)計(jì)算機(jī)實(shí)現(xiàn)智能視頻分析

    人工智能和物聯(lián)網(wǎng)取得重大進(jìn)步的時(shí)代,智能視頻分析(IVA)正在通過整合先進(jìn)的人工智能技術(shù)來改變視頻監(jiān)控和分析。這項(xiàng)革命性的技術(shù)增強(qiáng)了視覺智能,是關(guān)鍵行業(yè)創(chuàng)新解決方案的驅(qū)動(dòng)因素。
    的頭像 發(fā)表于 05-16 14:37 ?528次閱讀
    利用邊緣<b class='flag-5'>計(jì)算</b>和工業(yè)<b class='flag-5'>計(jì)算機(jī)</b>實(shí)現(xiàn)智能視頻分析

    一文帶你了解工業(yè)計(jì)算機(jī)尺寸

    一項(xiàng)艱巨的任務(wù)。本博客將指導(dǎo)您了解關(guān)鍵的工業(yè)計(jì)算機(jī)尺寸、使用案例。關(guān)鍵工業(yè)計(jì)算機(jī)外形要素及其使用案例一、工業(yè)微型PC尺寸范圍:寬度:100毫米-180毫米深度:10
    的頭像 發(fā)表于 04-24 13:35 ?691次閱讀
    一文帶你了解工業(yè)<b class='flag-5'>計(jì)算機(jī)</b>尺寸

    中科馭數(shù)DPU助力大模型訓(xùn)練和推理

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,大模型(如GPT、BERT等)自然語言處理、計(jì)算機(jī)視覺等領(lǐng)域取得了
    的頭像 發(fā)表于 02-19 09:48 ?984次閱讀
    中科馭數(shù)DPU助力大模型訓(xùn)練和推理

    Quantinuum“Reimei”量子計(jì)算機(jī)RIKEN正式運(yùn)行

    )成功安裝并全面投入運(yùn)行。 此次合作中,RIKEN為“Reimei”量子計(jì)算機(jī)提供了世界級(jí)的基礎(chǔ)設(shè)施,包括為其量身定制的設(shè)計(jì)、準(zhǔn)備及交付工作。這一里程碑式的成就不僅標(biāo)志著Quantinuum量子計(jì)算領(lǐng)域的持續(xù)
    的頭像 發(fā)表于 02-17 10:21 ?712次閱讀

    愛立信電信領(lǐng)域取得重大進(jìn)展

    近日,愛立信宣布電信領(lǐng)域取得了一項(xiàng)重大進(jìn)展——將大幅提高移動(dòng)運(yùn)營商管理不同環(huán)境中的用戶連接體驗(yàn)的能力。
    的頭像 發(fā)表于 02-12 10:34 ?7009次閱讀

    黃仁勛:我們正重新發(fā)明計(jì)算機(jī)

    ,人工智能技術(shù)的突破,為計(jì)算機(jī)領(lǐng)域帶來了前所未有的變革。這是一項(xiàng)停滯了60多年的重大技術(shù)進(jìn)展,它打破了傳統(tǒng)計(jì)算機(jī)的局限,為我們開辟了新的可能。他指出,自IBM推出System 360以
    的頭像 發(fā)表于 01-21 10:08 ?634次閱讀

    國外科研團(tuán)隊(duì)X射線科學(xué)領(lǐng)域取得了重大突破

    近日,據(jù)《自然·光子學(xué)》報(bào)道,歐洲X射線自由電子激光裝置(XFEL)和德國電子同步加速器研究中心團(tuán)隊(duì)X射線科學(xué)領(lǐng)域取得了重大突破。他們成功生成了前所未有的高功率、阿秒級(jí)硬X射線脈沖,且重復(fù)頻率達(dá)到
    的頭像 發(fā)表于 12-20 09:11 ?627次閱讀

    谷歌量子芯片實(shí)現(xiàn)計(jì)算領(lǐng)域重大突破

    近日,全球科技巨頭谷歌宣布,其新一代芯片在量子計(jì)算領(lǐng)域取得了前所未有的重大突破。據(jù)悉,谷歌成功地短短五分鐘內(nèi)解決了一個(gè)傳統(tǒng)計(jì)算機(jī)需要耗費(fèi)比
    的頭像 發(fā)表于 12-13 11:10 ?1057次閱讀

    工業(yè)中使用哪種計(jì)算機(jī)?

    使其成為工廠、倉庫和其他要求苛刻的工業(yè)環(huán)境的理想選擇。通過提供高性能和可靠性,工業(yè)計(jì)算機(jī)可確保高效、連續(xù)的運(yùn)行。工業(yè)計(jì)算機(jī)的類型工業(yè)環(huán)境中,人們使用各種專用
    的頭像 發(fā)表于 11-29 14:07 ?952次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計(jì)算機(jī)</b>?

    量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別

    超越世界最強(qiáng)大的超級(jí)計(jì)算機(jī),完成以前不可想象的任務(wù)!這意味著量子計(jì)算機(jī)可能會(huì)徹底改變我們的生活。 本文中,我們將先了解普通
    的頭像 發(fā)表于 11-24 11:00 ?2380次閱讀
    量子<b class='flag-5'>計(jì)算機(jī)</b>與普通<b class='flag-5'>計(jì)算機(jī)</b>工作原理的區(qū)別