Skip to content

Scikit-Learn 範例

這裡介紹四個機器學習實作範例,分別使用 SVM(分類)、線性回歸(回歸)、K-Means(分群)、PCA(降維) 來解決不同類型的問題。

📌 1. 分類(Classification)

在這個範例中,我們使用SVM來分類鳶尾花資料集。

什麼是SVM?

SVM(Support Vector Machine,支持向量機) 是一種常見的 分類演算法,它會找到一條最佳的「決策邊界」來將不同類別分開。

資料集(Dataset)

鳶尾花資料集

SVM 適合應用

✔ 垃圾郵件偵測 📩
✔ 健康診斷(是否患病)🏥

📌 2. 回歸(Regression)

在這個範例中,我們使用線性回歸(Linear Regression)來預測數據的值。

什麼是線性回歸?

線性回歸(Linear Regression) 是一種常見的 迴歸方法,它嘗試找出「輸入數據與輸出結果之間的直線關係」,用來預測數值。

資料集(Dataset)

使用亂數產生的資料集。

線性回歸適合應用

✔ 預測房價 🏡💰
✔ 預測氣溫 🌡️
✔ 預測銷售額 📊

📌 3. 分群(Clustering)

在這個範例中,我們使用 K-Means(K 均值演算法)針對資料做分群的動作。

什麼是 K-Means?

K-Means(K 均值演算法) 是一種 無監督學習(Unsupervised Learning) 方法,它能夠將數據分成 K 個群組(Clusters),而不需要標籤。

資料集(Dataset)

使用亂數產生的資料集。

K-Means 適合應用

✔ 客戶分類(市場行銷)🛍️
✔ 圖像分割(電腦視覺)📸
✔ 社群網絡分析(分組用戶行為)👥

📌 4. 降維(Dimensionality Reduction)

在這個範例中,我們使用PCA來做降維的動作,將鳶尾花資料集的維度降到二維,再畫出資料的分布圖。

什麼是 PCA?

PCA(Principal Component Analysis,主成分分析) 是一種 降維技術,它可以把「高維度數據」轉換成「低維度數據」,幫助視覺化或提高運算效率。

資料集(Dataset)

鳶尾花資料集。

PCA 適合應用

✔ 圖像壓縮 📷
✔ 基因數據分析 🧬
✔ 高維數據視覺化 📊

📝 5. 總結

類別 使用方法 適用範圍
分類(Classification) SVM(支持向量機) Email 垃圾郵件分類📩🚫、圖像辨識🐶🐱
回歸(Regression) Linear Regression(線性回歸) 預測房價🏡💰、氣溫🌡️
分群(Clustering) K-Means(K 均值演算法) 客戶分群🛒👥、市場行銷📢
降維(Dimensionality Reduction) PCA(主成分分析) 降低維度📊📉、影像處理📷

📌 這四種方法是機器學習最常見的基礎技術,適用於不同的應用場景!🚀🔥