3_1森林特徵重要性.ipynb
3_1森林特徵重要性.html
Google Colab
- 此示例顯示了使用森林來評估特徵在人工分類任務中的重要性,紅條是森林中基於雜質的特徵的重要性,以及它們在樹間的可變性
- 不出所料,該圖表明3個特徵是有信息的,而其餘特徵則沒有
- 警告:基於雜質的特徵重要性可能會誤導高基數特徵(許多唯一值)
- 導入需要套件
- numpy用於資料分析
- sklearn.datasets用於導入make_classification已建立分類資料
- sklearn.ensemble用於導入ExtraTrees分類模式
- 建立分類資料,其中有3個有資訊的特徵
- 建立森林並計算基於雜質的特徵重要性
- 印出特徵排名