亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶(hù)?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

三種用于垃圾網(wǎng)頁(yè)檢測(cè)的隨機(jī)欠采樣集成分類(lèi)器

大?。?/span>0.98 MB 人氣: 2017-12-06 需要積分:3

  針對(duì)垃圾網(wǎng)頁(yè)檢測(cè)過(guò)程中輕微的不平衡分類(lèi)問(wèn)題,提出三種隨機(jī)欠采樣集成分類(lèi)器算法,分別為一次不放回隨機(jī)欠采樣( RUS-once)、多次不放回隨機(jī)欠采樣(RUS-multiple)和有放回隨機(jī)欠采樣(RUS-replacement)算法。首先使用其中一種隨機(jī)欠采樣技術(shù)將訓(xùn)練樣本集轉(zhuǎn)換成平衡樣本集,然后對(duì)每個(gè)平衡樣本集使用分類(lèi)回歸樹(shù)( CART)分類(lèi)器算法進(jìn)行分類(lèi),最后采用簡(jiǎn)單投票法構(gòu)建集成分類(lèi)器對(duì)測(cè)試樣本進(jìn)行分類(lèi)。實(shí)驗(yàn)表明,三種隨機(jī)欠采樣集成分類(lèi)器均取得了良好的分類(lèi)效果,其中RUS-multiple和RUS-replacement比RUS-once的分類(lèi)效果更好。與CART及其Bagging和Adaboost集成分類(lèi)器相比,在WEBSPAM UK-2006數(shù)據(jù)集上,RUS-multiple和RUS-replacement方法的AUC指標(biāo)值提高了10%左右,在WEBSPAM UK-2007數(shù)據(jù)集上,提高了25%左右;與其他最優(yōu)研究結(jié)果相比,RUS-multiple和RUS-replacement方法在AUC指標(biāo)上能達(dá)到最優(yōu)分類(lèi)結(jié)果。

三種用于垃圾網(wǎng)頁(yè)檢測(cè)的隨機(jī)欠采樣集成分類(lèi)器

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶(hù)評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?