Scikit-Learn 範例
這裡介紹四個機器學習實作範例,分別使用 SVM(分類)、線性回歸(回歸)、K-Means(分群)、PCA(降維) 來解決不同類型的問題。
📌 1. 分類(Classification)
在這個範例中,我們使用SVM來分類鳶尾花資料集。
什麼是SVM?
SVM(Support Vector Machine,支持向量機) 是一種常見的 分類演算法,它會找到一條最佳的「決策邊界」來將不同類別分開。
資料集(Dataset)
鳶尾花資料集
SVM 適合應用
✔ 垃圾郵件偵測 📩
✔ 健康診斷(是否患病)🏥
📌 2. 回歸(Regression)
在這個範例中,我們使用線性回歸(Linear Regression)來預測數據的值。
什麼是線性回歸?
線性回歸(Linear Regression) 是一種常見的 迴歸方法,它嘗試找出「輸入數據與輸出結果之間的直線關係」,用來預測數值。
資料集(Dataset)
使用亂數產生的資料集。
線性回歸適合應用
✔ 預測房價 🏡💰
✔ 預測氣溫 🌡️
✔ 預測銷售額 📊
📌 3. 分群(Clustering)
在這個範例中,我們使用 K-Means(K 均值演算法)針對資料做分群的動作。
什麼是 K-Means?
K-Means(K 均值演算法) 是一種 無監督學習(Unsupervised Learning) 方法,它能夠將數據分成 K 個群組(Clusters),而不需要標籤。
資料集(Dataset)
使用亂數產生的資料集。
K-Means 適合應用
✔ 客戶分類(市場行銷)🛍️
✔ 圖像分割(電腦視覺)📸
✔ 社群網絡分析(分組用戶行為)👥
📌 4. 降維(Dimensionality Reduction)
在這個範例中,我們使用PCA來做降維的動作,將鳶尾花資料集的維度降到二維,再畫出資料的分布圖。
什麼是 PCA?
PCA(Principal Component Analysis,主成分分析) 是一種 降維技術,它可以把「高維度數據」轉換成「低維度數據」,幫助視覺化或提高運算效率。
資料集(Dataset)
鳶尾花資料集。
PCA 適合應用
✔ 圖像壓縮 📷
✔ 基因數據分析 🧬
✔ 高維數據視覺化 📊
📝 5. 總結
類別 | 使用方法 | 適用範圍 |
---|---|---|
分類(Classification) | SVM(支持向量機) | Email 垃圾郵件分類📩🚫、圖像辨識🐶🐱 |
回歸(Regression) | Linear Regression(線性回歸) | 預測房價🏡💰、氣溫🌡️ |
分群(Clustering) | K-Means(K 均值演算法) | 客戶分群🛒👥、市場行銷📢 |
降維(Dimensionality Reduction) | PCA(主成分分析) | 降低維度📊📉、影像處理📷 |
📌 這四種方法是機器學習最常見的基礎技術,適用於不同的應用場景!🚀🔥