3-1 降維(一)-特徵選擇
3-2 降維(二)-特徵提取
3-2-1 主成分分析
3-2-2 LDA與PCA在鳶尾花資料集應用
3-3 核主成分分析
假定資料中包含大量冗餘或無關變數(或稱特徵、屬性、指標等),從原有變數中找出主要變數
最具代表性的方法包括Lasso 、Elastic net
使用特徵選擇技術有三個原因
特徵選擇 VS 特徵提取
應用典型用例:解析書面文本、微陣列數據
🡪 特徵成千上萬,但樣本只有幾十到幾百個
3-1森林特徵重要性