PythonのseleniumでHTMLソースを取得する方法

2023年9月26日

PythonのSeleniumを使用してHTMLソースを取得する方法は非常に簡単です。以下に、HTMLソースを取得するための基本的なステップを示します。

Seleniumをインストール:
最初に、Seleniumをインストールする必要があります。pipを使用してインストールできます。
```
pip install selenium
```
WebDriverをダウンロード:
Seleniumはブラウザを制御するためにWebDriverと呼ばれるドライバーを使用します。WebDriverは使用するブラウザに応じて異なります。例えば、Google Chromeを使用する場合、ChromeDriverをダウンロードする必要があります。WebDriverはブラウザのバージョンに合わせて選択してください。

ChromeDriverのダウンロードリンク: https://sites.google.com/chromium.org/driver/

Seleniumスクリプトを作成:
PythonのスクリプトでSeleniumを使用してHTMLソースを取得します。以下は、Google Chromeを使用してHTMLソースを取得する例です。

python
from selenium import webdriver

# ChromeDriverのパスを指定してWebDriverを起動
driver = webdriver.Chrome(executable_path='/path/to/chromedriver')

# ターゲットのURLを開く
driver.get('https://example.com')

# HTMLソースを取得
html_source = driver.page_source

# ドライバーを閉じる
driver.quit()

# HTMLソースを表示
print(html_source)

スクリプトを実行:
スクリプトを実行すると、指定したURLのHTMLソースが取得され、コンソールに表示されます。

この方法を使用すると、Seleniumを使ってWebページからHTMLソースを取得することができます。ブラウザの種類やバージョンによってWebDriverを選択し、適切なWebDriverのパスを指定することを忘れないようにしてください。

目的別,Python,プログラミング,selenium

Posted by ぼっち

Pythonでディレクトリを作る方法

Pythonのtimeメソッド　tzname

コメント一覧

まだ、コメントがありません