Skip to content

DataFrame簡介

DataFramePandas 的二維數據結構,類似於 Excel 表格、SQL 資料表,適合用來處理結構化數據(如 CSV、JSON、資料庫)。


✅ 1. 建立 DataFrame

你可以用 字典(dict)、列表(list)、NumPy 陣列(numpy array) 來建立 DataFrame

🔹 用 dict 建立

import pandas as pd

data = {
    "姓名": ["小明", "小華", "小美"],
    "年齡": [20, 25, 22],
    "分數": [85, 90, 88]
}

df = pd.DataFrame(data)
print(df)

🔹 輸出

   姓名  年齡  分數
0  小明  20  85
1  小華  25  90
2  小美  22  88

每一列是 Series,每一行有索引 0, 1, 2,...


🔹 指定索引

df = pd.DataFrame(data, index=["A", "B", "C"])
print(df)

🔹 輸出

   姓名  年齡  分數
A  小明  20  85
B  小華  25  90
C  小美  22  88

索引可以自訂,不一定是 0, 1, 2,...


✅ 2. DataFrame 取值

🔹 取單欄

print(df["姓名"])

🔹 輸出

A    小明
B    小華
C    小美
Name: 姓名, dtype: object

取出的單欄是 Series


🔹 取單列

print(df.loc["A"])  # 透過索引名稱取值
print(df.iloc[0])   # 透過索引位置取值

🔹 輸出

姓名     小明
年齡     20
分數     85
Name: A, dtype: object

取出的單列是 Series


🔹 取特定區域(切片)

print(df.loc["A", "姓名"])  # 取 A 行的「姓名」
print(df.iloc[0, 0])        # 取 0 行 0 列的值
print(df.loc[:, ["姓名", "分數"]])  # 取所有行的「姓名」和「分數」

支援 loc(標籤)與 iloc(數字索引)存取數據


✅ 3. DataFrame 運算

🔹 新增欄位

df["性別"] = ["男", "男", "女"]
print(df)

🔹 條件篩選

print(df[df["分數"] > 85])  # 取分數大於 85 的學生

🔹 數據統計

print(df.describe())  # 統計數據(平均數、標準差等)

📌 總結

功能 用法
建立 DataFrame pd.DataFrame(data)
取欄位 df["欄名"]
取列 df.loc["索引"], df.iloc[行數]
篩選 df[df["分數"] > 85]
新增欄位 df["新欄位"] = 值

🚀 DataFrame 適用於表格型數據處理,如數據分析、機器學習前處理等! 😊