Pythonのseleniumでhrefやsrc属性を取得する方法

PythonのSeleniumを使用してhrefsrc属性を取得する方法は非常に簡単です。要素を見つけてからその属性を取得するだけです。以下に、href属性とsrc属性を取得するための基本的なステップを示します。

  1. Seleniumをインストール:
    まだSeleniumをインストールしていない場合は、次のコマンドを使用してインストールします。

    pip install selenium
    
  2. WebDriverをダウンロード:
    Seleniumはブラウザを制御するためにWebDriverと呼ばれるドライバーを使用します。WebDriverは使用するブラウザに合わせて異なります。例えば、Google Chromeを使用する場合、ChromeDriverをダウンロードする必要があります。WebDriverはブラウザのバージョンに合わせて選択してください。

    ChromeDriverのダウンロードリンク: https://sites.google.com/chromium.org/driver/

  3. Seleniumスクリプトを作成:
    PythonのスクリプトでSeleniumを使用してhrefsrc属性を取得します。以下は、Google Chromeを使用してhref属性とsrc属性を取得する例です。

    python
    from selenium import webdriver
    
    # ChromeDriverのパスを指定してWebDriverを起動
    driver = webdriver.Chrome(executable_path='/path/to/chromedriver')
    
    # ターゲットのURLを開く
    driver.get('https://example.com')
    
    # href属性を取得
    href_attribute = driver.find_element_by_tag_name('a').get_attribute('href')
    
    # src属性を取得
    src_attribute = driver.find_element_by_tag_name('img').get_attribute('src')
    
    # ドライバーを閉じる
    driver.quit()
    
    # 取得した属性を表示
    print("href属性:", href_attribute)
    print("src属性:", src_attribute)
    

このスクリプトでは、find_element_by_tag_nameを使用して<a>要素と<img>要素を見つけ、get_attributeを使用してそれぞれの要素からhref属性とsrc属性を取得しています。適切な要素を見つけるために必要に応じて別の方法を使用できます。

これにより、指定した要素のhrefsrc属性の値が取得され、コンソールに表示されます。