1. ホーム
  2. Python
  3. 【Python】BeautifulSoupで取得した要素(タグ)の属性値を抽出

【Python】BeautifulSoupで取得した要素(タグ)の属性値を抽出

こんにちは、nishi_talk(@nishi_talk)です。
今回はPythonのBeautifulSoupで取得した要素(タグ)の属性値を抽出をご紹介します。



前提条件

もう既にpythonとBeautifulSoupが動作している状態。
BeautifulSoupを使用していてある特定のinputタグのvalueを抽出する場面が合ったので、備忘録として掲載。

例として以下のHTMLの以下の値を取得したいとします。

inputタグ→id名「data」→「value」

<html>
    <head>
    ・・・
    </head>
    <body>
        選択してください。
         ・・・  
           <input id="data" value="value01">
         ・・・
    <body>
</html>

クローラー用のpythonファイルに以下の記述をして、特定のタグを取得します。

import logging
import requests
from bs4 import BeautifulSoup

url = 'http://hoge/xxx.html'
res = requests.get(url)
soup = BeautifulSoup(res.content, 'html5lib')

# ID「data」を持っているinputタグを抽出
js = soup.find('input',id='data')
# valueの値を抽出
jsonData = js['value']
logging.info(jsonData)



Pythonの参考書籍

私がPythonを勉強したときに使った書籍をご紹介します。

カテゴリー