將醫(yī)學(xué)影像交給人工智能 (AI) 來分析,可以比人類專家更快、更準確地檢測和測量出異常情況,推動基于影像的醫(yī)療診斷更進一步發(fā)展。要借此來改善患者的治療效果并確立針對性的治療方法,就必須建立起在不同人群中具有普遍性的高質(zhì)量AI模型。然而,要建立這樣的AI模型,就離不開大量數(shù)據(jù)的支持,并且這些數(shù)據(jù)還需要經(jīng)過精心標注,才能供機器來學(xué)習(xí)。
現(xiàn)在,我們可以通過深度學(xué)習(xí) (DL) 的一個分支——弱監(jiān)督學(xué)習(xí)來完成AI的訓(xùn)練。這項機器學(xué)習(xí)技術(shù)可以降低對數(shù)據(jù)標注的完整性和準確性要求,幫助醫(yī)生更輕松地獲得更加深入的信息。用于弱監(jiān)督學(xué)習(xí)的數(shù)據(jù)只需進行更容易實現(xiàn)的粗略標注 (例如只需標注整個影像,而不必標注影像中細分的關(guān)鍵區(qū)域) ,并且學(xué)習(xí)過程中可以充分利用預(yù)訓(xùn)練模型和常見的可解釋性方法。本文中,我們將研究數(shù)據(jù)管理在弱監(jiān)督學(xué)習(xí)中發(fā)揮的重要作用。
醫(yī)學(xué)影像的標注并非易事
醫(yī)療行業(yè)中的影像標注存在著許多困難。首先,醫(yī)學(xué)影像本身以及相關(guān)的檢查結(jié)果數(shù)據(jù)往往存儲在不同的系統(tǒng)中,導(dǎo)致數(shù)據(jù)標注工作困難重重,也就難以獲得經(jīng)過標注的數(shù)據(jù)。例如,來自計算機斷層掃描 (CT) 或磁共振成像 (MRI) 的影像數(shù)據(jù)可能存儲在醫(yī)院系統(tǒng)中,但相關(guān)的活檢或腫瘤切除檢查結(jié)果往往會存儲在病理實驗室中,而這些實驗室可能位于醫(yī)院之外的私人診所或檢測機構(gòu)。這時,如果要核對某些數(shù)據(jù)和標注的話,雖然做法上可行,但獲取并匯總數(shù)據(jù)的工作可能會花費大量時間,尤其是在涉及不止一家私人診所或檢測機構(gòu)的情況下。
而且,要在影像中尋找并標記出疾病發(fā)生和進展的跡象 (生物標志物) ,本身就是一件極其耗時并且復(fù)雜的事情,因為這些數(shù)據(jù)必須逐個像素地進行標注,最終的標記數(shù)量可達上千個。如果需要通過算法來分割影像或者定位到特定區(qū)域 (如病變或手術(shù)邊界) 的話,這一問題尤為嚴重。這樣的過程往往需要耗費大量成本,因為醫(yī)學(xué)影像標注通常要借助專業(yè)知識才能進行,而且MRI和CT影像還需要做三維標注。這兩項缺點加在一起,使醫(yī)學(xué)影像的標注成為了一項成本不菲的工作,而且還難以通過外包來完成。
由于標注過程需要用到專業(yè)知識,標注的質(zhì)量也會因標注人員對這些知識掌握程度的不同而發(fā)生變化,進而影響到深度學(xué)習(xí)模型的最終表現(xiàn)。對于數(shù)據(jù)標注而言,標注的準確性是一大問題。通常情況下,經(jīng)驗不足的放射科醫(yī)生或住院醫(yī)師會接受數(shù)據(jù)標注培訓(xùn),但他們的標注準確度顯然比不上有著數(shù)十年工作經(jīng)驗的臨床醫(yī)生。此外,閱片人員所表現(xiàn)出的差異也會影響到標注的結(jié)果:一方面,不同的閱片人員對同一幅影像的解讀會有細微差異;另一方面,同一個閱片人員如果在不同時間標注同一幅影像,最終結(jié)果也會有細微的區(qū)別
最后,人工標注這件事本身也會限制最終結(jié)果。機器學(xué)習(xí)的一大優(yōu)勢在于模型可以發(fā)現(xiàn)人類無法察覺的規(guī)律,然而人工標注終究依賴于人工輸入,模型最終輸出的結(jié)果很容易因此而受到限制。例如,AI如果只能復(fù)制人類對某些任務(wù)的想法,那么它就很可能無意中把某個人的偏見也復(fù)制過來。此外,輸入數(shù)據(jù)中某些看似無關(guān)區(qū)域的特征也可能具有預(yù)測性,但由于它們不在人為選定的關(guān)注區(qū)域內(nèi),因而會直接被拋棄。例如,疾病的顯著指征完全可能出現(xiàn)在關(guān)注區(qū)域周邊的其他組織中,甚至可能會出現(xiàn)在附近的其他器官中。
運用弱監(jiān)督學(xué)習(xí)來進行訓(xùn)練
在上述場景中,我們更希望AI可以接受更加籠統(tǒng)的標注(例如一幅影像中是否包含癌癥組織或其他疾病指征),然后再由模型來找出其中最能說明問題的特征。這正是弱監(jiān)督學(xué)習(xí)的用武之地。
弱監(jiān)督學(xué)習(xí)是深度學(xué)習(xí)的一個分支,旨在通過更少、更粗略的標注來生成性能良好的深度學(xué)習(xí)模型。這些標注大致可以分為三大類:不完整、不精確和不準確的標注。這里使用“大致”一詞是因為單個數(shù)據(jù)集中可以結(jié)合使用多種標注方法,并且弱監(jiān)督標注的目的就是根據(jù)需要來解決各種組合問題。
不完整的標注通常表現(xiàn)為數(shù)據(jù)集的一部分被標注,而其余部分未被標注。
不精確的標注則是直接標注出影像的整體結(jié)果,不對特定關(guān)注區(qū)域進行分割。
不準確的標注源于標注人員缺乏專業(yè)知識,以及某些疾病指征之間的模糊性或不確定性。
有趣的是,如果通過更粗略、更容易實現(xiàn)的標注就可以產(chǎn)生不錯的結(jié)果,那么不精確的標注可能比不完整或不準確的標注更有用。不精確的標注不容易出錯,因為它不需要達到像其他標注那樣的詳細程度,而且它也更容易獲得:例如只需從掃描報告中提取出有關(guān)癌癥分期的信息,就可以表明該掃描影像包含癌癥組織,而不必再通過人工的方式把癌變區(qū)域從三維影像中“摳”出來。這些標注自身雖然“不精確”,但卻可以讓數(shù)據(jù)集獲得更多可用的標注,進而提升準確度。尤為重要的是,通過這種標注方式,我們就不必再為了標出一切相關(guān)的細枝末節(jié)而花大價錢雇傭或培養(yǎng)高度專業(yè)的人員。這種方式最終可以提高標注的準確性,畢竟給出一個二選一的答案遠比詳細描繪出所有特征來得容易。
要在常見的醫(yī)學(xué)影像應(yīng)用 (例如檢測和定位關(guān)鍵區(qū)域) 中利用這種不精確的標注,比較常見的做法是利用以下兩步流程:
打造主干模型,例如訓(xùn)練一個深度學(xué)習(xí)模型來預(yù)測由不精確的標注所描述的類別。
在對特定掃描影像進行預(yù)測的模型中,使用像素屬性方法 (也稱為顯著性或可解釋性方法) 將模型決策的最相關(guān)區(qū)域突顯出來。
使用卷積神經(jīng)網(wǎng)絡(luò)作為主干
醫(yī)療領(lǐng)域經(jīng)常需要用到影像數(shù)據(jù),因而將卷積神經(jīng)網(wǎng)絡(luò) (CNN) 用作弱監(jiān)督學(xué)習(xí)主要的基礎(chǔ)深度學(xué)習(xí)框架就是自然而然的選擇。CNN的工作原理是通過學(xué)習(xí)來減少醫(yī)學(xué)掃描影像中需要處理的像素量 (通常是將三維圖像降維表示) ,然后將這些像素對應(yīng)到類別標注。
在弱監(jiān)督學(xué)習(xí)中,我們還可以結(jié)合使用多種方法。您可以使用自己的數(shù)據(jù)集訓(xùn)練新的網(wǎng)絡(luò) (如果該數(shù)據(jù)集足以提供其他類似數(shù)據(jù)源的優(yōu)勢) ,也可以使用預(yù)先訓(xùn)練好的網(wǎng)絡(luò)來對新任務(wù)進行遷移學(xué)習(xí)。例如,ResNet50和VGG16就是利用源自日常生活的數(shù)百萬張圖片來訓(xùn)練的兩種CNN架構(gòu)。雖然它們并沒有使用醫(yī)學(xué)影像進行過訓(xùn)練,但它們?nèi)匀环浅S杏?,因為在模型早期階段的層中學(xué)習(xí)到的卷積過濾器往往涉及的是通用的特征,如線條、形狀和紋理等,這對醫(yī)學(xué)影像依然是有用的。
要使用這些模型之一來進行遷移學(xué)習(xí),只需去掉后期階段的類別預(yù)測層,然后用代表新的醫(yī)學(xué)影像任務(wù)所需類別的層來重新初始化即可。雖然模型的最終目標是讓輸出結(jié)果能夠突顯出影像中的相關(guān)物體和值得關(guān)注的區(qū)域,但首先進行的第一步只需預(yù)測影像中是否存在這些值得關(guān)注的區(qū)域即可。
弱監(jiān)督定位的AI可解釋性
當深度學(xué)習(xí)主干完成訓(xùn)練,可以準確預(yù)測是否存在值得關(guān)注的類別后,下一步便是使用某種AI可解釋性方法來分割關(guān)注區(qū)域。這些可解釋性方法 (也稱為像素屬性方法) 旨在深入了解深度學(xué)習(xí)模型在做出某種預(yù)測時在圖像中看到的內(nèi)容,其輸出是某種形式的圖像 (通常稱為顯著圖) ,可以根據(jù)最終目標以多種不同的方法計算得出。
在這些方法中,基于梯度的顯著圖是最常用的方法之一,其核心包括輸出預(yù)測以及對所有構(gòu)成該輸出的神經(jīng)元進行檢測。根據(jù)方法的不同,這種檢測可以一直追溯到第一個輸入層——標準梯度 (Vanilla Gradient) ,也可以停留在某個較后期的層,如神經(jīng)網(wǎng)絡(luò)架構(gòu)中的最后一個卷積層——GradCAM 。其他的方法可以實現(xiàn)不同的目的,例如產(chǎn)生更平滑的關(guān)注區(qū)域、改善更簡單的方法存在的局限性,或在所需特征周圍進行更緊密的分割。
結(jié)語
就在不久前,識別醫(yī)學(xué)影像中的生物標志物依然還需要大量以復(fù)雜方式進行標注的影像數(shù)據(jù)。然而,弱監(jiān)督學(xué)習(xí)等技術(shù)降低了對數(shù)據(jù)標注完整性、精確性和準確性的要求,從而能夠輕松揭示出以往需要耗費大量時間、借助高度專業(yè)的知識才能發(fā)現(xiàn)的問題。弱監(jiān)督學(xué)習(xí)只需采用更容易實現(xiàn)的粗略標注 (例如只標注整個影像,而不是標注影像中細分的關(guān)鍵區(qū)域) 就可以運作。它可以重新利用預(yù)先訓(xùn)練好的CNN模型,然后使用常見的可解釋性方法,根據(jù)預(yù)測的類別將值得關(guān)注的區(qū)域突顯出來。在這些特性的支持下,便可以將使用醫(yī)學(xué)影像數(shù)據(jù)訓(xùn)練的模型用于各種應(yīng)用,無需進行大量像素級標注。這不僅節(jié)省了時間和成本,更有可能發(fā)現(xiàn)臨床醫(yī)生以前未曾了解的預(yù)測特征,從而提高診斷的準確性、改善患者的治療效果。
審核編輯:郭婷
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4821瀏覽量
106449 -
人工智能
+關(guān)注
關(guān)注
1813文章
49594瀏覽量
260015 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5588瀏覽量
123810
發(fā)布評論請先 登錄
使用MATLAB進行無監(jiān)督學(xué)習(xí)
醫(yī)學(xué)影像設(shè)備學(xué)發(fā)展記錄
醫(yī)學(xué)影像發(fā)展歷史
CBIR技術(shù)在醫(yī)學(xué)影像數(shù)據(jù)庫的設(shè)計與研究
人工智能與醫(yī)學(xué)影像的完美結(jié)合
眾多醫(yī)學(xué)影像AI企業(yè)開發(fā)了相關(guān)的醫(yī)學(xué)影像AI產(chǎn)品
機器學(xué)習(xí)算法中有監(jiān)督和無監(jiān)督學(xué)習(xí)的區(qū)別
最基礎(chǔ)的半監(jiān)督學(xué)習(xí)
為什么半監(jiān)督學(xué)習(xí)是機器學(xué)習(xí)的未來?
深度學(xué)習(xí):基于語境的文本分類弱監(jiān)督學(xué)習(xí)
基于 U-Net 的醫(yī)學(xué)影像分割算法
機器學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)應(yīng)用在哪些領(lǐng)域
融合零樣本學(xué)習(xí)和小樣本學(xué)習(xí)的弱監(jiān)督學(xué)習(xí)方法綜述
弱監(jiān)督學(xué)習(xí)解鎖醫(yī)學(xué)影像洞察力

通過弱監(jiān)督學(xué)習(xí)揭示醫(yī)學(xué)影像中的秘密
評論