今回はPythonのBeautifulSoupで取得した要素(タグ)の属性値を抽出をご紹介します。
前提条件
もう既にpythonとBeautifulSoupが動作している状態。BeautifulSoupを使用していてある特定のinputタグのvalueを抽出する場面が合ったので、備忘録として掲載。 例として以下のHTMLの以下の値を取得したいとします。 inputタグ→id名「data」→「value」
<html>
<head>
・・・
</head>
<body>
選択してください。
・・・
<input id="data" value="value01">
・・・
<body>
</html>
import logging
import requests
from bs4 import BeautifulSoup
url = 'http://hoge/xxx.html'
res = requests.get(url)
soup = BeautifulSoup(res.content, 'html5lib')
# ID「data」を持っているinputタグを抽出
js = soup.find('input',id='data')
# valueの値を抽出
jsonData = js['value']
logging.info(jsonData)