Pandas簡介
pandas
是 Python 用來處理表格資料的函式庫,類似 Excel,但功能更強大,適合分析數據。以下 pandas
的簡單教學:
1. 安裝與導入
如果還沒安裝 pandas
,可以先執行:
然後在 Python 程式中引入:
2. 建立第一個 DataFrame(類似 Excel 表格)
DataFrame
就像是表格,我們可以用字典 (dict
) 來創建:
import pandas as pd
data = {
"姓名": ["小明", "小華", "小美"],
"年齡": [16, 17, 16],
"成績": [90, 85, 95]
}
df = pd.DataFrame(data)
print(df)
結果:
📌 重點:pandas
把資料變成 像 Excel 的表格,方便整理和分析!
3. 讀取 CSV 檔案(像 Excel 的資料)
如果有 .csv
檔案(用逗號分隔的表格),可以讀取:
📌 這樣可以快速讀取大量數據,不用手動輸入!
4. 查詢與選取資料
(1) 取出特定欄位
(2) 取出特定列
(3) 篩選條件
5. 新增、修改與刪除欄位
(1) 新增欄位
(2) 修改資料
(3) 刪除欄位
6. 常見統計運算
pandas 可以直接計算數據:
print(df["成績"].mean()) # 計算平均成績
print(df["年齡"].max()) # 找出最大年齡
print(df["成績"].min()) # 找出最低成績
print(df.describe()) # 顯示數據統計資訊
📌 這樣就能快速分析數據,不用手動計算!
7. 排序
可以用 sort_values()
來排序:
📌 這樣就能快速找到最高或最低成績的學生!
8. 與 Matplotlib 搭配畫圖
可以用 pandas
分析數據,然後用 matplotlib
畫出來:
📌 這樣就能讓數據更直觀!
9. 小挑戰
讓學生試試看:
- 新增一個「班級」欄位,填入「A班」「B班」「A班」
- 找出成績大於 90 的學生
- 把成績從高到低排序
- 用
pandas
+matplotlib
畫出不同班級的平均成績
這樣的教學方式可以讓國高中生快速入門 pandas
,並學習如何分析資料 🚀