PythonのseleniumでHTMLソースを取得する方法

PythonのSeleniumを使用してHTMLソースを取得する方法は非常に簡単です。以下に、HTMLソースを取得するための基本的なステップを示します。

  1. Seleniumをインストール:
    最初に、Seleniumをインストールする必要があります。pipを使用してインストールできます。

    pip install selenium
    
  2. WebDriverをダウンロード:
    Seleniumはブラウザを制御するためにWebDriverと呼ばれるドライバーを使用します。WebDriverは使用するブラウザに応じて異なります。例えば、Google Chromeを使用する場合、ChromeDriverをダウンロードする必要があります。WebDriverはブラウザのバージョンに合わせて選択してください。

    ChromeDriverのダウンロードリンク: https://sites.google.com/chromium.org/driver/

  3. Seleniumスクリプトを作成:
    PythonのスクリプトでSeleniumを使用してHTMLソースを取得します。以下は、Google Chromeを使用してHTMLソースを取得する例です。

    python
    from selenium import webdriver
    
    # ChromeDriverのパスを指定してWebDriverを起動
    driver = webdriver.Chrome(executable_path='/path/to/chromedriver')
    
    # ターゲットのURLを開く
    driver.get('https://example.com')
    
    # HTMLソースを取得
    html_source = driver.page_source
    
    # ドライバーを閉じる
    driver.quit()
    
    # HTMLソースを表示
    print(html_source)
    
  4. スクリプトを実行:
    スクリプトを実行すると、指定したURLのHTMLソースが取得され、コンソールに表示されます。

この方法を使用すると、Seleniumを使ってWebページからHTMLソースを取得することができます。ブラウザの種類やバージョンによってWebDriverを選択し、適切なWebDriverのパスを指定することを忘れないようにしてください。