Skip to content

Pandas簡介

pandas 是 Python 用來處理表格資料的函式庫,類似 Excel,但功能更強大,適合分析數據。以下 pandas 的簡單教學:


1. 安裝與導入

如果還沒安裝 pandas,可以先執行:

pip install pandas

然後在 Python 程式中引入:

import pandas as pd

2. 建立第一個 DataFrame(類似 Excel 表格)

DataFrame 就像是表格,我們可以用字典 (dict) 來創建:

import pandas as pd

data = {
    "姓名": ["小明", "小華", "小美"],
    "年齡": [16, 17, 16],
    "成績": [90, 85, 95]
}

df = pd.DataFrame(data)
print(df)

結果:

   姓名  年齡  成績
0  小明  16  90
1  小華  17  85
2  小美  16  95

📌 重點pandas 把資料變成 像 Excel 的表格,方便整理和分析!

3. 讀取 CSV 檔案(像 Excel 的資料)

如果有 .csv 檔案(用逗號分隔的表格),可以讀取:

df = pd.read_csv("data.csv")  # 讀取 CSV 檔
print(df.head())  # 顯示前 5 列

📌 這樣可以快速讀取大量數據,不用手動輸入!

4. 查詢與選取資料

(1) 取出特定欄位

print(df["姓名"])  # 取得 "姓名" 欄位

(2) 取出特定列

print(df.iloc[0])  # 取得第一列(索引從 0 開始)

(3) 篩選條件

df_16 = df[df["年齡"] == 16]  # 取得年齡為 16 的學生
print(df_16)

5. 新增、修改與刪除欄位

(1) 新增欄位

df["性別"] = ["男", "男", "女"]  # 新增一個 "性別" 欄位
print(df)

(2) 修改資料

df.loc[1, "成績"] = 88  # 把第二列的 "成績" 改成 88

(3) 刪除欄位

df = df.drop(columns=["性別"])  # 刪除 "性別" 欄位
print(df)

6. 常見統計運算

pandas 可以直接計算數據:

print(df["成績"].mean())  # 計算平均成績
print(df["年齡"].max())   # 找出最大年齡
print(df["成績"].min())   # 找出最低成績
print(df.describe())      # 顯示數據統計資訊

📌 這樣就能快速分析數據,不用手動計算!

7. 排序

可以用 sort_values() 來排序:

df = df.sort_values(by="成績", ascending=False)  # 按成績由高到低排序
print(df)

📌 這樣就能快速找到最高或最低成績的學生!

8. 與 Matplotlib 搭配畫圖

可以用 pandas 分析數據,然後用 matplotlib 畫出來:

import matplotlib.pyplot as plt

df.plot(x="姓名", y="成績", kind="bar")  # 以長條圖顯示學生成績
plt.show()

📌 這樣就能讓數據更直觀!

9. 小挑戰

讓學生試試看:

  1. 新增一個「班級」欄位,填入「A班」「B班」「A班」
  2. 找出成績大於 90 的學生
  3. 把成績從高到低排序
  4. pandas + matplotlib 畫出不同班級的平均成績

這樣的教學方式可以讓國高中生快速入門 pandas,並學習如何分析資料 🚀