什么是小樣本學習?它與弱監(jiān)督學習等問題有何差異?其核心問題是什么?來自港科大和第四范式的這篇綜述論文提供了解答。
數(shù)據是機器學習領域的重要資源,在數(shù)據缺少的情況下如何訓練模型呢?小樣本學習是其中一個解決方案。來自香港科技大學和第四范式的研究人員綜述了該領域的研究發(fā)展,并提出了未來的研究方向。 這篇綜述論文已被 ACM Computing Surveys 接收,作者還建立了 GitHub repo,用于更新該領域的發(fā)展。
論文地址:https://arxiv.org/pdf/1904.05046.pdf
GitHub 地址:https://github.com/tata1661/FewShotPapers
機器學習在數(shù)據密集型應用中取得了很大成功,但在面臨小數(shù)據集的情況下往往捉襟見肘。近期出現(xiàn)的小樣本學習(Few-Shot Learning,F(xiàn)SL)方法旨在解決該問題。FSL 利用先驗知識,能夠快速泛化至僅包含少量具備監(jiān)督信息的樣本的新任務中。 這篇論文對 FSL 方法進行了綜述。首先,該論文給出了 FSL 的正式定義,并厘清了它與相關機器學習問題(弱監(jiān)督學習、不平衡學習、遷移學習和元學習)的關聯(lián)和差異。然后指出 FSL 的核心問題,即經驗風險最小化方法不可靠。 基于各個方法利用先驗知識處理核心問題的方式,該研究將 FSL 方法分為三大類:
數(shù)據:利用先驗知識增強監(jiān)督信號;
模型:利用先驗知識縮小假設空間的大?。?/p>
算法:利用先驗知識更改給定假設空間中對最優(yōu)假設的搜索。
最后,這篇文章提出了 FSL 的未來研究方向:FSL 問題設置、技術、應用和理論。 論文概覽 該綜述論文所覆蓋的主題見下圖:

我們選取介紹了該綜述論文中的部分內容,詳情參見原論文。 什么是小樣本學習? FSL 是機器學習的子領域。 我們先來看機器學習的定義: 計算機程序基于與任務 T 相關的經驗 E 學習,并得到性能改進(性能度量指標為 P)。

基于此,該研究將 FSL 定義為: 小樣本學習是一類機器學習問題,其經驗 E 中僅包含有限數(shù)量的監(jiān)督信息。

下圖對比了具備充足訓練樣本和少量訓練樣本的學習算法:

FSL 方法分類 根據先驗知識的利用方式,F(xiàn)SL 方法可分為三類:

FSL 方法解決少樣本問題的不同角度。 基于此,該研究將現(xiàn)有的 FSL 方法納入此框架,得到如下分類體系:

數(shù)據 此類 FSL 方法利用先驗知識增強數(shù)據 D_train,從而擴充監(jiān)督信息,利用充足數(shù)據來實現(xiàn)可靠的經驗風險最小化。

如上圖所示,根據增強數(shù)據的來源,這類 FSL 方法可分為以下三個類別:

模型 基于所用先驗知識的類型,這類方法可分為如下四個類別:

算法 根據先驗知識對搜索策略的影響,此類方法可分為三個類別:

文章最后從問題設置、技術、應用和理論四個層面探討了小樣本學習領域的未來發(fā)展方向。
責任編輯:彭菁
-
數(shù)據
+關注
關注
8文章
7308瀏覽量
93672 -
機器學習
+關注
關注
66文章
8534瀏覽量
136079 -
小樣本
+關注
關注
0文章
7瀏覽量
6919
原文標題:小樣本學習最新綜述
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
LED燈條未來的發(fā)展方向
嵌入式領域的職業(yè)發(fā)展方向怎么樣?
FPGA學習方法及發(fā)展方向
學習嵌入式的優(yōu)勢和發(fā)展方向
答疑解惑探討小樣本學習的最新進展
深度學習:小樣本學習下的多標簽分類問題初探
融合零樣本學習和小樣本學習的弱監(jiān)督學習方法綜述
一種基于偽標簽半監(jiān)督學習的小樣本調制識別算法
人工智能(chatGPT)未來發(fā)展方向
DC電源模塊的未來發(fā)展方向與挑戰(zhàn)

小樣本學習領域的未來發(fā)展方向
評論