資料介紹
一種改進的基于粗糙集理論的特征選取方法_王作飛
文本分類是文本挖掘的重要組成部分。通過該技術可以自 動地為文檔集合中的每篇文檔確定類別, 并對它們進行有效組 織和分類,以便檢索和分析,從而能夠使用戶方便、快捷地瀏覽 文檔,具有很高的實際應用價值。文本分類一般分為訓練和分類 階段,在分類階段,文本集經(jīng)過文本預處理后得到特征集。但是 特征集仍然是個高維的特征空間, 對于所有的分類算法來說維 數(shù)都太大。因此,選擇一個合適的特征方法,以降低特征空間的 維數(shù),提高分類的效率和精度,往往成為文本分類的首選任務和 關鍵。 目前,常用的特征選擇算法一般是先構建一個評估函數(shù),對 特征集中的每個特征獨立地進行評估每個特征獲得一個評估 值,然后根據(jù)評估值對特征進行排序,最后選取最佳的特征作為 類別中心特征向量。而選取多少個最佳特征主要針對某一個具 體的問題通過實驗來決定?,F(xiàn)在這樣的評估函數(shù)有:文檔頻數(shù), 信息增益,期望交叉熵,互信息,CHI 統(tǒng)計法等。 作為一種處理含糊和不精確問題的新型數(shù)學工具, 粗糙集 在處理不完備、不確定、不一致數(shù)據(jù)方面顯現(xiàn)出了其特有的優(yōu) 勢。針對以往基于粗糙集理論中正區(qū)域約簡特征選取在處理不 一致決策表時存在的不足,本文通過過引入粒度函數(shù)的概念,并 以此為基礎采用粗糙集啟發(fā)式屬性約簡方法實現(xiàn)了特征在分 類中的重要性度量標定和約簡, 使原來的特征維數(shù)得到一定的 降低,建立了特征選擇與文本分類之間的聯(lián)系。該方法有效地提 高了分類的效率和準確度,大大降低了文本分類子集的維數(shù),生 成規(guī)則易于理解, 適應性強。最后用實驗驗證了該方法的可行
文本分類是文本挖掘的重要組成部分。通過該技術可以自 動地為文檔集合中的每篇文檔確定類別, 并對它們進行有效組 織和分類,以便檢索和分析,從而能夠使用戶方便、快捷地瀏覽 文檔,具有很高的實際應用價值。文本分類一般分為訓練和分類 階段,在分類階段,文本集經(jīng)過文本預處理后得到特征集。但是 特征集仍然是個高維的特征空間, 對于所有的分類算法來說維 數(shù)都太大。因此,選擇一個合適的特征方法,以降低特征空間的 維數(shù),提高分類的效率和精度,往往成為文本分類的首選任務和 關鍵。 目前,常用的特征選擇算法一般是先構建一個評估函數(shù),對 特征集中的每個特征獨立地進行評估每個特征獲得一個評估 值,然后根據(jù)評估值對特征進行排序,最后選取最佳的特征作為 類別中心特征向量。而選取多少個最佳特征主要針對某一個具 體的問題通過實驗來決定?,F(xiàn)在這樣的評估函數(shù)有:文檔頻數(shù), 信息增益,期望交叉熵,互信息,CHI 統(tǒng)計法等。 作為一種處理含糊和不精確問題的新型數(shù)學工具, 粗糙集 在處理不完備、不確定、不一致數(shù)據(jù)方面顯現(xiàn)出了其特有的優(yōu) 勢。針對以往基于粗糙集理論中正區(qū)域約簡特征選取在處理不 一致決策表時存在的不足,本文通過過引入粒度函數(shù)的概念,并 以此為基礎采用粗糙集啟發(fā)式屬性約簡方法實現(xiàn)了特征在分 類中的重要性度量標定和約簡, 使原來的特征維數(shù)得到一定的 降低,建立了特征選擇與文本分類之間的聯(lián)系。該方法有效地提 高了分類的效率和準確度,大大降低了文本分類子集的維數(shù),生 成規(guī)則易于理解, 適應性強。最后用實驗驗證了該方法的可行
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 權重模糊粗糙集的改進規(guī)則挖掘算法 4次下載
- 程度多粒度軟粗糙集模型綜述 1次下載
- 一種基于粗糙集聚類的報文格式推斷方法 3次下載
- 一種統(tǒng)計粗糙集模型 0次下載
- 一種改進的變精度粗糙集漏洞威脅評估模型 0次下載
- 粗糙集理論的數(shù)據(jù)挖掘方法在水泥生產(chǎn)分解爐中的應用_王夙娟 0次下載
- 粗糙集方法在紅外圖像增強中的應用
- 基于粗糙集理論的網(wǎng)絡入侵檢測系統(tǒng)
- 基于粗糙集理論的空氣質量智能數(shù)據(jù)分析
- 基于粗糙集規(guī)則提取算法的研究及應用
- 基于遺傳算法的誤差因子粗糙集模型
- 基于粗糙集的啟發(fā)式約簡算法
- 基于概率粗糙集模型的信息檢索
- 基于粗糙集理論的除氧系統(tǒng)智能控制器設計
- 基于粗糙集理論的入侵檢測方法研究
- 一種簡單高效配置FPGA的方法 745次閱讀
- 一種完全分布式的點線協(xié)同視覺慣性導航系統(tǒng) 469次閱讀
- 電源濾波電容如何選取? 3097次閱讀
- FLAT的一種改進方案 1779次閱讀
- 基于改進FCOS的鋼帶表面缺陷檢測算法 1692次閱讀
- 一種基于DSP+FPGA結構的通用飛控計算機設計方法介紹 2453次閱讀
- 人工智能是一種改進數(shù)據(jù)控制和處理的方法 3165次閱讀
- 研究人員提出了一種多尺度高效率的新模型FAMED-Net 3911次閱讀
- OpenAI提出了一種回報設置方法RND 3202次閱讀
- 一種自動生成反向傳播方程的方法 3857次閱讀
- 【新專利介紹】一種改進電表 1314次閱讀
- 基于激光誘導超塑性的卷對卷工藝制程是一種新的制造方法 5152次閱讀
- 一種新的基于電穿孔的皮膚高效核酸遞送方法 5187次閱讀
- 基于特征模理論和CMA技術的天線設計 9819次閱讀
- 一種matlab調用signaltap采集數(shù)據(jù)的方法 3949次閱讀
下載排行
本周
- 1PID控制算法學習筆記資料
- 3.43 MB | 3次下載 | 2 積分
- 2匯聯(lián)芯橋代理_HL817_USB3.1 HUB控制器 提供樣品與設計資料
- 1.05 MB | 1次下載 | 免費
- 3VLI威鋒代理-VL103-擴展塢PD3.0協(xié)議芯片,typeCPD充電輸出DP信號 替代VL102
- 1.18 MB | 1次下載 | 免費
- 4一種抗輻射加固檢錯糾錯電路的設計
- 0.32 MB | 次下載 | 2 積分
- 5NVS800校驗手操器操作說明書
- 0.54 MB | 次下載 | 免費
- 6瑞芯微代理 RK628F Datasheet V1 HDMI轉MIPI/LVDS 視頻橋接芯片
- 1.29 MB | 次下載 | 免費
- 78232A/8232B中文數(shù)據(jù)手冊
- 0.57 MB | 次下載 | 2 積分
- 8SW5099規(guī)格書
- 1.37 MB | 次下載 | 1 積分
本月
- 1如何看懂電子電路圖
- 12.88 MB | 272次下載 | 免費
- 2PC5502負載均流控制電路數(shù)據(jù)手冊
- 1.63 MB | 12次下載 | 免費
- 3RK3588數(shù)據(jù)手冊
- 2.24 MB | 12次下載 | 免費
- 4ESP32開發(fā)板元件資料
- 0.03 MB | 8次下載 | 免費
- 5OAH0428 V1.0英文規(guī)格書
- 5.86 MB | 8次下載 | 免費
- 6PC1032 5.5V_3A高效率同步降壓轉換器數(shù)據(jù)手冊
- 0.76 MB | 3次下載 | 免費
- 7臺達變頻器VFD-M使用手冊
- 2.51 MB | 3次下載 | 免費
- 8PID控制算法學習筆記資料
- 3.43 MB | 3次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935132次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191414次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183349次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81599次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73818次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65990次下載 | 10 積分
電子發(fā)燒友App






創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論