亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習(xí)特征工程的五個方面優(yōu)點

汽車玩家 ? 來源:今日頭條 ? 作者:不一樣的程序猿 ? 2020-03-15 16:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特征工程是用數(shù)學(xué)轉(zhuǎn)換的方法將原始輸入數(shù)據(jù)轉(zhuǎn)換為用于機器學(xué)習(xí)模型的新特征。特征工程提高了機器學(xué)習(xí)模型的準確度和計算效率,體現(xiàn)在以下五個方面

1、把原始數(shù)據(jù)轉(zhuǎn)換成與目標(biāo)相關(guān)的數(shù)據(jù)

我們可以使用特征工程對原始數(shù)據(jù)進行轉(zhuǎn)換,使其更接近目標(biāo)變量,轉(zhuǎn)換后的特征對目標(biāo)更有預(yù)測性。在這種情況下,雖然未加工輸入出現(xiàn)在原始數(shù)據(jù)集中,但如果將轉(zhuǎn)換后的特征作為輸入,則機器學(xué)習(xí)將提高預(yù)測的準確性。

2、引入額外的數(shù)據(jù)源

特征工程可以使從業(yè)者向機器學(xué)習(xí)模型引入額外的數(shù)據(jù)源。對于首次注冊的用戶,我們可以猜測該用戶的終生價值。在眾多指標(biāo)中,我們可以捕捉每個用戶的地理位置。雖然這個數(shù)據(jù)可以直接作為分類特征(例如,IP地址和郵政編碼)提供,但模型基于這些來確定位置信息仍存在困難。

通過第三方的人口統(tǒng)計數(shù)據(jù),我們可以做的更好。例如,這將允許我們計算每個用戶區(qū)域的平均收入和人口密度,并把這些因素直接插入到訓(xùn)練集中?,F(xiàn)在,這些預(yù)測性因素立即變得更容易推斷,而不是依賴模型從原始位置數(shù)據(jù)推斷這種微妙的關(guān)系。更進一步,位置信息轉(zhuǎn)換成收入和人口密度的特征工程,可使我們估計這些位置衍生出的特征哪一個更為重要。

3、使用非結(jié)構(gòu)化的數(shù)據(jù)源

特征工程可使我們在機器學(xué)習(xí)模型中使用非結(jié)構(gòu)化的數(shù)據(jù)源。許多數(shù)據(jù)源本質(zhì)上并不是結(jié)構(gòu)化的特征向量。非結(jié)構(gòu)化數(shù)據(jù),如文本、時間序列、圖像、視頻、日志數(shù)據(jù)和點擊流等,占創(chuàng)建數(shù)據(jù)的絕大多數(shù)。特征工程使從業(yè)者從上述原始數(shù)據(jù)流中產(chǎn)生機器學(xué)習(xí)的特征向量。

4、創(chuàng)建更容易解釋的特征

特征工程使機器學(xué)習(xí)的從業(yè)者能夠創(chuàng)建更易于解釋和實用的特征。通常,使用機器學(xué)習(xí)發(fā)現(xiàn)數(shù)據(jù)中的模式,對于產(chǎn)生精確的預(yù)測十分有用,但會遇到模型的可解釋性和模型的最終應(yīng)用的一些限制。這些情況下,在驅(qū)動數(shù)據(jù)生成、鏈接原始數(shù)據(jù)和目標(biāo)變量的過程中,產(chǎn)生更有指示性的新特征,這樣更有價值。

5、用大特征集提高創(chuàng)造性

特征工程使得我們可以扔進大量的特征,觀察它們代表了什么。我們能創(chuàng)建盡可能多的數(shù)據(jù),觀察在訓(xùn)練模型中哪些更有預(yù)測力。這使得機器學(xué)習(xí)的從業(yè)者在創(chuàng)建和測試特征時擺脫僵化心理,并能夠發(fā)現(xiàn)新的趨勢和模式。

雖然當(dāng)幾十個甚至上百個特征用于訓(xùn)練機器學(xué)習(xí)模型時,過擬合成為一個問題,但嚴謹?shù)奶卣鬟x擇算法,可減少特征使其易于管理。例如,我們可以自主選擇前10個特征的預(yù)測,與所有1000個特征的預(yù)測是一樣好,還是優(yōu)于后者。

特征工程

引自《機器學(xué)習(xí)實戰(zhàn)》

在機器學(xué)習(xí)應(yīng)用領(lǐng)域中,特征工程扮演著非常重要的角色,可以說特征工程是機器學(xué)習(xí)應(yīng)用的基礎(chǔ)。在機器學(xué)習(xí)業(yè)界流傳著這樣一句話:“數(shù)據(jù)和特征決定了機器學(xué)習(xí)算法的上限,而模型和算法只是不斷逼近而已?!痹跈C器學(xué)習(xí)應(yīng)用中,特征工程介于“數(shù)據(jù)”和“模型”之間,特征工程是使用數(shù)據(jù)的專業(yè)領(lǐng)域知識創(chuàng)建能夠使機器學(xué)習(xí)算法工作的特征的過程,而好的數(shù)據(jù)勝于多的數(shù)據(jù)。美國計算機科學(xué)家Peter Norvig有兩句經(jīng)典名言:“基于大量數(shù)據(jù)的簡單模型勝于少量數(shù)據(jù)的復(fù)雜模型?!币约啊案嗟臄?shù)據(jù)勝于聰明的算法,而好的數(shù)據(jù)勝于多的數(shù)據(jù)。”因此,特征工程的前提是收集足夠多的數(shù)據(jù),其次是從大量數(shù)據(jù)中提取關(guān)鍵信息并表示為模型所需要的形式。合適的特征可以讓模型預(yù)測更加容易,機器學(xué)習(xí)應(yīng)用更有可能成功。

引自《美團機器學(xué)習(xí)》

在監(jiān)督機器學(xué)習(xí)過程中,我們使用數(shù)據(jù)教自動系統(tǒng)如何做出準確的決策。機器學(xué)習(xí)算法被設(shè)計成發(fā)現(xiàn)模式和歷史訓(xùn)練數(shù)據(jù)間的聯(lián)系;它們從數(shù)據(jù)中學(xué)習(xí)并將學(xué)習(xí)結(jié)果編碼到模型中,從而對新數(shù)據(jù)的重要屬性做出準確的預(yù)測。因此,訓(xùn)練數(shù)據(jù)是機器學(xué)習(xí)中的基本問題。有了高質(zhì)量的數(shù)據(jù),就可以捕捉到細微的差別和關(guān)聯(lián)關(guān)系,從而建立高保真的預(yù)測系統(tǒng)。相反,若訓(xùn)練數(shù)據(jù)質(zhì)量不佳,則再好的機器學(xué)習(xí)算法也無濟于事。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    大電磁頻譜管理監(jiān)測系統(tǒng)軟件:有哪些優(yōu)點和缺點

    大電磁頻譜管理監(jiān)測系統(tǒng)軟件:有哪些優(yōu)點和缺點
    的頭像 發(fā)表于 09-28 16:50 ?440次閱讀
    <b class='flag-5'>五</b>大電磁頻譜管理監(jiān)測系統(tǒng)軟件:有哪些<b class='flag-5'>優(yōu)點</b>和缺點

    大海上安全事件應(yīng)急處置系統(tǒng):有哪些優(yōu)點和缺點

    大海上安全事件應(yīng)急處置系統(tǒng):有哪些優(yōu)點和缺點
    的頭像 發(fā)表于 09-04 17:09 ?587次閱讀
    <b class='flag-5'>五</b>大海上安全事件應(yīng)急處置系統(tǒng):有哪些<b class='flag-5'>優(yōu)點</b>和缺點

    FPGA在機器學(xué)習(xí)中的具體應(yīng)用

    ,越來越多地被應(yīng)用于機器學(xué)習(xí)任務(wù)中。本文將探討 FPGA 在機器學(xué)習(xí)中的應(yīng)用,特別是在加速神經(jīng)網(wǎng)絡(luò)推理、優(yōu)化算法和提升處理效率方面的優(yōu)勢。
    的頭像 發(fā)表于 07-16 15:34 ?2429次閱讀

    SOLIDWORKS教育版——全方面學(xué)習(xí)資源與教程

    功能,更以其全方面學(xué)習(xí)資源與教程,為學(xué)生構(gòu)建了一從理論到實踐、從基礎(chǔ)到進階的完整學(xué)習(xí)體系。本文將深入探討SOLIDWORKS教育版如何憑借其豐富的
    的頭像 發(fā)表于 04-23 11:03 ?583次閱讀
    SOLIDWORKS教育版——全<b class='flag-5'>方面</b>的<b class='flag-5'>學(xué)習(xí)</b>資源與教程

    傳統(tǒng)機器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會介紹傳統(tǒng)機器學(xué)習(xí)的基礎(chǔ)知識和多種算法特征,供各位老師選擇。 01 傳統(tǒng)
    的頭像 發(fā)表于 12-30 09:16 ?1773次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    使用機器學(xué)習(xí)改善庫特征提取的質(zhì)量和運行時間

    有預(yù)期工作條件下按規(guī)范運行。但由于特征化數(shù)據(jù)的復(fù)雜性和數(shù)量,傳統(tǒng)的庫特征提取和驗證在計算和工程工作量方面的成本變得越來越高昂。
    的頭像 發(fā)表于 12-26 11:15 ?671次閱讀
    使用<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>改善庫<b class='flag-5'>特征</b>提取的質(zhì)量和運行時間

    cmp在機器學(xué)習(xí)中的作用 如何使用cmp進行數(shù)據(jù)對比

    機器學(xué)習(xí)領(lǐng)域,"cmp"這個術(shù)語可能并不是一常見的術(shù)語,它可能是指"比較"(comparison)的縮寫。 比較在機器學(xué)習(xí)中的作用 模型
    的頭像 發(fā)表于 12-17 09:35 ?1240次閱讀

    【面試題】人工智能工程師高頻面試題匯總:機器學(xué)習(xí)深化篇(題目+答案)

    隨著人工智能技術(shù)的突飛猛進,AI工程師成為了眾多求職者夢寐以求的職業(yè)。想要拿下這份工作,面試的時候得展示出你不僅技術(shù)過硬,還得能解決問題。所以,提前準備一些面試常問的問題,比如機器學(xué)習(xí)的那些算法
    的頭像 發(fā)表于 12-16 13:42 ?3179次閱讀
    【面試題】人工智能<b class='flag-5'>工程</b>師高頻面試題匯總:<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>深化篇(題目+答案)

    構(gòu)建云原生機器學(xué)習(xí)平臺流程

    構(gòu)建云原生機器學(xué)習(xí)平臺是一復(fù)雜而系統(tǒng)的過程,涉及數(shù)據(jù)收集、處理、特征提取、模型訓(xùn)練、評估、部署和監(jiān)控等多個環(huán)節(jié)。
    的頭像 發(fā)表于 12-14 10:34 ?635次閱讀

    人工智能工程師高頻面試題匯總——機器學(xué)習(xí)

    隨著人工智能技術(shù)的突飛猛進,AI工程師成為了眾多求職者夢寐以求的職業(yè)。想要拿下這份工作,面試的時候得展示出你不僅技術(shù)過硬,還得能解決問題。所以,提前準備一些面試常問的問題,比如機器學(xué)習(xí)的那些算法
    的頭像 發(fā)表于 12-04 17:00 ?2052次閱讀
    人工智能<b class='flag-5'>工程</b>師高頻面試題匯總——<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>篇

    ASR和機器學(xué)習(xí)的關(guān)系

    自動語音識別(ASR)技術(shù)的發(fā)展一直是人工智能領(lǐng)域的一重要分支,它使得機器能夠理解和處理人類語言。隨著機器學(xué)習(xí)(ML)技術(shù)的迅猛發(fā)展,ASR系統(tǒng)的性能和準確性得到了顯著提升。 ASR
    的頭像 發(fā)表于 11-18 15:16 ?1076次閱讀

    什么是機器學(xué)習(xí)?通過機器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機器學(xué)習(xí)”最初的研究動機是讓計算機系統(tǒng)具有人的學(xué)習(xí)能力以便實現(xiàn)人工智能。因為沒有學(xué)習(xí)能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?1418次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    eda在機器學(xué)習(xí)中的應(yīng)用

    值和噪聲數(shù)據(jù)。通過繪制箱線圖、直方圖和散點圖,我們可以直觀地看到數(shù)據(jù)中的異常值和分布情況。例如,如果一數(shù)據(jù)集中的某個特征值遠高于其他值,這可能是一異常值,需要進一步調(diào)查。 2. 特征
    的頭像 發(fā)表于 11-13 10:42 ?1237次閱讀

    LLM和傳統(tǒng)機器學(xué)習(xí)的區(qū)別

    在人工智能領(lǐng)域,LLM(Large Language Models,大型語言模型)和傳統(tǒng)機器學(xué)習(xí)是兩種不同的技術(shù)路徑,它們在處理數(shù)據(jù)、模型結(jié)構(gòu)、應(yīng)用場景等方面有著顯著的差異。 1. 模型結(jié)構(gòu)
    的頭像 發(fā)表于 11-08 09:25 ?2602次閱讀

    MLOps平臺優(yōu)點

    MLOps平臺在提升機器學(xué)習(xí)模型的開發(fā)與部署效率、可擴展性與靈活性、透明度與可重復(fù)性以及降低風(fēng)險和持續(xù)改進方面具有顯著優(yōu)點。
    的頭像 發(fā)表于 11-06 10:10 ?616次閱讀