① BeautifulSoup 簡介¶
如前面的章節說的,BeautifulSoup
是剖析資料的工具,這個章節裡面,我們簡單的說明一下它的使用方式。
載入套件¶
In [ ]:
Copied!
from bs4 import BeautifulSoup
from bs4 import BeautifulSoup
給定一個HTML格式的字串¶
In [ ]:
Copied!
s = """
<!DOCTYPE html>
<html>
<head>
<title>這是範例二</title>
<style>
.class1 {font-family: Microsoft JhengHei;background-color: yellow;}
</style>
</head>
<body>
<h1>哈囉!HTML!</h1>
<div class="class1">
<p>這是第一個段落!</p>
<p>這是第二個段落!</p>
</div>
<div class="class2">
<p>這是第三個段落!</p>
<p>這是第四個段落!</p>
</div>
</body>
</html>
"""
s = """
這是範例二
"""
哈囉!HTML!
這是第一個段落!
這是第二個段落!
這是第三個段落!
這是第四個段落!
將字串丟給BeautifulSoup
做剖析¶
In [ ]:
Copied!
soup = BeautifulSoup(s)
soup = BeautifulSoup(s)
使用find
或select
搜尋剖析的結果¶
In [ ]:
Copied!
soup.select('p')
soup.select('p')
📖 參考資料¶
CSS Selector 的使用請參考:
BeautifulSoup 的其他使用方式,請參考: