Pythonのseleniumでtable / tr / th / tdタグを取得する方法

2023年10月5日

PythonのSeleniumを使用して<table>（表）、<tr>（表の行）、<th>（表のヘッダセル）、<td>（表のデータセル）タグを取得するには、find_elements_by_tag_nameメソッドを使用します。以下は、Seleniumを使用してこれらの要素を取得する方法の例です。

python
from selenium import webdriver

# WebDriverのインスタンスを作成（例：Chrome用のWebDriver）
driver = webdriver.Chrome(executable_path='/path/to/chromedriver')

# ウェブページを開く
driver.get('https://example.com')

# <table>タグを取得
table_elements = driver.find_elements_by_tag_name('table')

# 各<table>タグ内の<tr>タグを取得して表示
for table_element in table_elements:
    tr_elements = table_element.find_elements_by_tag_name('tr')
    for tr_element in tr_elements:
        # <tr>内の<th>タグ（ヘッダセル）を取得して表示
        th_elements = tr_element.find_elements_by_tag_name('th')
        for th_element in th_elements:
            th_text = th_element.text
            print("ヘッダセルのテキスト:", th_text)
        
        # <tr>内の<td>タグ（データセル）を取得して表示
        td_elements = tr_element.find_elements_by_tag_name('td')
        for td_element in td_elements:
            td_text = td_element.text
            print("データセルのテキスト:", td_text)

# WebDriverを終了
driver.quit()

このコードでは、Seleniumを使用してWebDriverのインスタンスを作成し、指定したURLのウェブページを開きます。それからfind_elements_by_tag_nameメソッドを使用して、すべての<table>タグを取得します。次に、各表内の<tr>タグを取得し、さらに各<tr>タグ内の<th>タグ（ヘッダセル）と<td>タグ（データセル）を取得してそのテキストを表示します。

この方法を使用して、Seleniumを使ってウェブページから表の要素やセルのデータを取得できます。必要な処理を行う際にこれらの情報を活用できます。

目的別,Python,プログラミング,selenium

Posted by ぼっち

Pythonでjsonを読み込む(開く)方法各種

PythonのException(例外処理)　tracebackのエラー一覧

コメント一覧

まだ、コメントがありません