Scikit-Learn 範例

這裡介紹四個機器學習實作範例，分別使用 SVM（分類）、線性回歸（回歸）、K-Means（分群）、PCA（降維） 來解決不同類型的問題。

📌 1. 分類（Classification）

在這個範例中，我們使用SVM來分類鳶尾花資料集。

什麼是SVM？

SVM（Support Vector Machine，支持向量機） 是一種常見的 分類演算法，它會找到一條最佳的「決策邊界」來將不同類別分開。

資料集(Dataset)

鳶尾花資料集

SVM 適合應用

✔ 垃圾郵件偵測 📩
✔ 健康診斷（是否患病）🏥

在這個範例中，我們使用線性回歸(Linear Regression)來預測數據的值。

什麼是線性回歸？

線性回歸（Linear Regression） 是一種常見的 迴歸方法，它嘗試找出「輸入數據與輸出結果之間的直線關係」，用來預測數值。

資料集(Dataset)

使用亂數產生的資料集。

線性回歸適合應用

✔ 預測房價 🏡💰
✔ 預測氣溫 🌡️
✔ 預測銷售額 📊

在這個範例中，我們使用 K-Means（K 均值演算法）針對資料做分群的動作。

什麼是 K-Means？

K-Means（K 均值演算法） 是一種 無監督學習（Unsupervised Learning） 方法，它能夠將數據分成 K 個群組（Clusters），而不需要標籤。

資料集(Dataset)

使用亂數產生的資料集。

K-Means 適合應用

✔ 客戶分類（市場行銷）🛍️
✔ 圖像分割（電腦視覺）📸
✔ 社群網絡分析（分組用戶行為）👥

在這個範例中，我們使用PCA來做降維的動作，將鳶尾花資料集的維度降到二維，再畫出資料的分布圖。

什麼是 PCA？

PCA（Principal Component Analysis，主成分分析） 是一種 降維技術，它可以把「高維度數據」轉換成「低維度數據」，幫助視覺化或提高運算效率。

資料集(Dataset)

鳶尾花資料集。

PCA 適合應用

✔ 圖像壓縮 📷
✔ 基因數據分析 🧬
✔ 高維數據視覺化 📊

類別	使用方法	適用範圍
分類（Classification）	SVM（支持向量機）	Email 垃圾郵件分類📩🚫、圖像辨識🐶🐱
回歸（Regression）	Linear Regression（線性回歸）	預測房價🏡💰、氣溫🌡️
分群（Clustering）	K-Means（K 均值演算法）	客戶分群🛒👥、市場行銷📢
降維（Dimensionality Reduction）	PCA（主成分分析）	降低維度📊📉、影像處理📷

📌 這四種方法是機器學習最常見的基礎技術，適用於不同的應用場景！🚀🔥