本篇文章給大家分享的是有關(guān)Python中Selenium如何使用,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
成都創(chuàng)新互聯(lián)專業(yè)網(wǎng)站制作、網(wǎng)站建設(shè),集網(wǎng)站策劃、網(wǎng)站設(shè)計(jì)、網(wǎng)站制作于一體,網(wǎng)站seo、網(wǎng)站優(yōu)化、網(wǎng)站營銷、軟文營銷等專業(yè)人才根據(jù)搜索規(guī)律編程設(shè)計(jì),讓網(wǎng)站在運(yùn)行后,在搜索中有好的表現(xiàn),專業(yè)設(shè)計(jì)制作為您帶來效益的網(wǎng)站!讓網(wǎng)站建設(shè)為您創(chuàng)造效益。
Selenium是一個(gè)Web的自動(dòng)化測試工具,最初是為網(wǎng)站自動(dòng)化測試而開發(fā)的,Selenium 可以直接運(yùn)行在瀏覽器上,它支持所有主流的瀏覽器(包括PhantomJS這些無界面的瀏覽器(2018年開發(fā)者說暫停開發(fā),chromedriver也可以實(shí)現(xiàn)同樣的功能)),可以接收指令,讓瀏覽器自動(dòng)加載頁面,獲取需要的數(shù)據(jù),甚至頁面截屏。
pip install selenium
Chromedriver 也是一個(gè)能夠被selenium驅(qū)動(dòng)的瀏覽器,但是和PhantomJS(網(wǎng)上有很多這個(gè)的介紹)的區(qū)別在于它是有界面的。Chromedriver下載你需要先查看自己的Chrome瀏覽器的版本,然后選擇對應(yīng)的Chromedriver。
下載地址:https://npm.taobao.org/mirrors/chromedriver
----- Windows 下安裝方式 chromedriver_win32.zip : 版本 ChromeDriver v2.32 (2017-08-30) (支持 Chrome v59-61) 1. 解壓 chromedriver_win32.zip 2. 將 chromedriver.exe 移動(dòng)到 Python安裝目錄下 (其實(shí)放哪都可以,但是需要配環(huán)境變量,放Python安裝目錄下省事) 注意:Chromedriver和電腦上的chrome版本有對應(yīng)關(guān)系,建議使用最新的Chromedriver版本并且更新chrome瀏覽器到最新版
是否開啟無頭模式(即是否需要界面)
from selenium.webdriver import Chrome from selenium.webdriver.chrome.options import Options option = Options() # 實(shí)例化option對象 option.add_argument("--headless") # 給option對象添加無頭參數(shù) driver = Chrome(executable_path=r"E:\python學(xué)習(xí)\python爬蟲\chromedriver.exe", # 實(shí)例化瀏覽器對象,可以指定chromedriver的路徑,不指定的話 默認(rèn)會(huì)去找python解釋器的同級目錄 options=option) # 實(shí)例化瀏覽器對象的時(shí)候 把option對象帶進(jìn)來
保存當(dāng)前網(wǎng)頁的截圖
from selenium.webdriver import Chrome driver = Chrome(executable_path=r"E:\python學(xué)習(xí)\python爬蟲\chromedriver.exe", # 實(shí)例化瀏覽器對象,可以指定chromedriver的路徑,不指定的話 默認(rèn)會(huì)去找python解釋器的同級目錄 # options=option) # 實(shí)例化瀏覽器對象的時(shí)候 把option對象帶進(jìn)來 ) driver.get("https://www.baidu.com/") driver.save_screenshot('baidu.png') # 保存當(dāng)前網(wǎng)頁的截圖 driver.close() # 關(guān)閉當(dāng)前網(wǎng)頁
瀏覽器窗口最大化
from selenium.webdriver import Chrome driver = Chrome(executable_path=r"E:\python學(xué)習(xí)\python爬蟲\chromedriver.exe") driver.maximize_window() # 瀏覽器窗口最大化
在input輸入框中輸入數(shù)據(jù)
from selenium.webdriver import Chrome driver = Chrome(executable_path=r"E:\python學(xué)習(xí)\python爬蟲\chromedriver.exe") driver.maximize_window() # 瀏覽器窗口最大化 ele = driver.find_element_by_id("kw") # 找到id為kw的節(jié)點(diǎn) ele.send_keys("數(shù)學(xué)") # 向input輸入框輸入數(shù)據(jù)
模擬點(diǎn)擊
from selenium.webdriver import Chrome driver = Chrome(executable_path=r"E:\python學(xué)習(xí)\python爬蟲\chromedriver.exe") driver.maximize_window() # 瀏覽器窗口最大化 ele = driver.find_element_by_id("kw") # 找到id為kw的節(jié)點(diǎn) ele.send_keys("數(shù)學(xué)") # 向input輸入框輸入數(shù)據(jù) ele = driver.find_element_by_id('su') # 找到id為su的節(jié)點(diǎn)(百度一下) ele.click() # 模擬點(diǎn)擊
根據(jù)文本值查找節(jié)點(diǎn)
# 找到文本值為百度一下的節(jié)點(diǎn) driver.find_element_by_link_text("百度一下") # 根據(jù)鏈接包含的文本獲取元素列表,模糊匹配 driver.find_elements_by_partial_link_text("度一下")
獲取當(dāng)前節(jié)點(diǎn)的文本
ele.text # 獲取當(dāng)前節(jié)點(diǎn)的文本 ele.get_attribute("data-click") # 獲取到屬性對應(yīng)的value
打印當(dāng)前網(wǎng)頁的一些信息
print(driver.page_source) # 打印網(wǎng)頁的源碼 print(driver.get_cookies()) # 打印出網(wǎng)頁的cookie print(driver.current_url) # 打印出當(dāng)前網(wǎng)頁的url
關(guān)閉瀏覽器
driver.close() # 關(guān)閉當(dāng)前網(wǎng)頁 driver.quit() # 直接關(guān)閉瀏覽器
頁面等待
from selenium.webdriver import Chrome import time from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC driver = Chrome(executable_path=r"E:\python學(xué)習(xí)\python爬蟲\chromedriver.exe") driver.get("https://www.baidu.com/") # time.sleep(1) driver.implicitly_wait(5) # 跟time.sleep類似,比time.sleep更加智能,不會(huì)被動(dòng)的等待時(shí)間結(jié)束 wait = WebDriverWait(driver, 10) # 等待時(shí)間 ele = wait.until(EC.presence_of_element_located((By.ID, "kw"))) ele.send_keys("數(shù)學(xué)") wait = WebDriverWait(driver, 10) ele = wait.until(EC.element_to_be_clickable((By.ID, 'su'))) ele.click() time.sleep(3) driver.close()
1. 獲取當(dāng)前所有的窗口
current_windows = driver.window_handles #返回一個(gè)list.
2. 根據(jù)窗口索引進(jìn)行切換
driver.switch_to.window(current_windows[0])
3. selenium切換iframe
driver.switch_to.frame("iframe的id")
4.切換進(jìn)入alert
alert = driver.switch_to.alert()
from selenium.webdriver import Chrome import time driver = Chrome(executable_path=r"E:\python學(xué)習(xí)\python爬蟲\chromedriver.exe") driver.get( "https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=78000241_12_hao_pg&wd=selenium%20js%E6%BB%91%E5%8A%A8&fenlei=256&rsv_pq=8215ec3a00127601&rsv_t=a763fm%2F7SHtPeSVYKeWnxKwKBisdp%2FBe8pVsIapxTsrlUnas7%2F7Hoo6FnDp6WsslfyiRc3iKxP2s&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug3=31&rsv_sug1=17&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&inputT=9266&rsv_sug4=9770") # 1.滾動(dòng)到網(wǎng)頁底部 js = "document.documentElement.scrollTop=800" # 執(zhí)行js driver.execute_script(js) time.sleep(1) # 滾動(dòng)到頂部 js = "document.documentElement.scrollTop=0" driver.execute_script(js) # 執(zhí)行js time.sleep(1) driver.close()
selenium能夠執(zhí)行頁面上的js,對于js渲染的數(shù)據(jù)和模擬登陸處理起來非常容易。
selenium由于在獲取頁面的過程中會(huì)發(fā)送很多請求,所以效率非常低,所以在很多時(shí)候需要酌情使用。
以上就是Python中Selenium如何使用,小編相信有部分知識點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
當(dāng)前文章:Python中Selenium如何使用
網(wǎng)站路徑:http://bm7419.com/article24/jdepce.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制網(wǎng)站、域名注冊、App設(shè)計(jì)、用戶體驗(yàn)、標(biāo)簽優(yōu)化、搜索引擎優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)