機器學(xué)習(xí)的本質(zhì),其實就是模仿人類大腦進行學(xué)習(xí)的過程,通過讓機器模仿這種學(xué)習(xí)過程實現(xiàn)所謂的“智能”。
經(jīng)過近幾十年的發(fā)展,機器學(xué)習(xí)的方法也越來越成熟,主要有以下幾種:
- 監(jiān)督學(xué)習(xí)
- 無監(jiān)督學(xué)習(xí)
- 強化學(xué)習(xí)
- 深度學(xué)習(xí)
- 深度強化學(xué)習(xí)
如上圖所示,機器學(xué)習(xí)是從左往右的發(fā)展方向,每一階段的學(xué)習(xí)方法都比上一代優(yōu)秀了很多。
下面簡單介紹這幾種機器學(xué)習(xí)方法的工作原理。
監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)指的是讓機器從現(xiàn)有的標(biāo)注好的已知數(shù)據(jù)中學(xué)習(xí)預(yù)測模型的學(xué)習(xí)方法。
簡單來說,先給定計算機一組標(biāo)記好的數(shù)據(jù),讓計算機用回歸或分類的方法計算出數(shù)據(jù)與標(biāo)記之間的經(jīng)驗關(guān)系。
通過這種方式,計算機最終會得出一個預(yù)測模型,訓(xùn)練數(shù)據(jù)越多,預(yù)測模型越準(zhǔn)確。
而所謂的“回歸”和“分類”方法,是計算機的兩種尋找規(guī)律的方式。具體如下:
回歸方法
計算機通過給定的標(biāo)記與數(shù)據(jù)之間的特征值,計算出標(biāo)記與數(shù)據(jù)之間的經(jīng)驗關(guān)系。
這種方法最終得到的預(yù)測模型其實就是“經(jīng)驗關(guān)系”。當(dāng)訓(xùn)練完成,你可以使用模型對未知數(shù)據(jù)進行預(yù)測,以此來測試計算機是否已經(jīng)學(xué)習(xí)到了。
分類方法
分類方法指的是讓計算機將性質(zhì)相似的數(shù)據(jù)分類為一個組。這種方法得到的模型是一個分類器。
訓(xùn)練完成后,你可以使用未知數(shù)據(jù)讓分類器進行分類,根據(jù)分類結(jié)果判斷計算機的預(yù)測精度水平。
監(jiān)督學(xué)習(xí)的方法包括:KNN、SVN等。
無監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)是相對于監(jiān)督學(xué)習(xí)來講的,是對監(jiān)督學(xué)習(xí)的升級版。
無監(jiān)督學(xué)習(xí)指的是從無標(biāo)注的數(shù)據(jù)集中學(xué)習(xí)預(yù)測模型的方法。
監(jiān)督學(xué)習(xí)需要給計算機標(biāo)記好的訓(xùn)練集,而無監(jiān)督學(xué)習(xí)不需要人工標(biāo)記訓(xùn)練集,計算機會根據(jù)現(xiàn)有的數(shù)據(jù)集的特征,自動對數(shù)據(jù)集進行分類。
無監(jiān)督學(xué)習(xí)的方法有:聚類、K均值、PCA等
強化學(xué)習(xí)
強化學(xué)習(xí)與監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)最大的區(qū)別,就是它不是一個分類任務(wù)。
強化學(xué)習(xí)訓(xùn)練時,需要環(huán)境給予反饋,以及對應(yīng)具體的反饋值。通過反饋值告訴預(yù)測模型預(yù)測結(jié)果是“好”還是“壞”,然后通過外界的反饋結(jié)果調(diào)整預(yù)測模型。
深度學(xué)習(xí)
深度學(xué)習(xí)是無監(jiān)督學(xué)習(xí)的一種,它模仿的是人類大腦神經(jīng)網(wǎng)絡(luò)。
常用的深度學(xué)習(xí)方法有深度神經(jīng)網(wǎng)絡(luò)、深度信念網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)等。
深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
深度強化學(xué)習(xí)
深度學(xué)習(xí)具有較強的感知能力,但是缺乏一定的決策能力;而強化學(xué)習(xí)具有決策能力,對感知問題束手無策。因此,深度強化學(xué)習(xí)將深度學(xué)習(xí)和強化學(xué)習(xí)相結(jié)合,優(yōu)勢互補,為復(fù)雜系統(tǒng)的感知決策問題提供了解決思路。
該技術(shù)在機器人、視頻游戲、金融和醫(yī)療領(lǐng)域取得了巨大成功。許多以前無法解決的問題現(xiàn)在通過創(chuàng)建DRL模型得到了解決。
-
計算機
+關(guān)注
關(guān)注
19文章
7742瀏覽量
92543 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8536瀏覽量
136105 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5588瀏覽量
123809
發(fā)布評論請先 登錄
嵌入式系統(tǒng)學(xué)習(xí)方法
0.96寸OLED使用文檔新手必看V2.0
Linux新手級學(xué)習(xí)者教程-Linux操作系統(tǒng)技術(shù)合集

新手必看的機器學(xué)習(xí)的方法合集
評論