python爬虫从0到1 -selenium的基本使用

   日期:2024-12-26    作者:wsqy870727 移动:http://mip.riyuangf.com/mobile/quote/30501.html

print(content)

python爬虫从0到1 -selenium的基本使用

(四)selenium的元素定位

===================================================================================

元素定位即自动化要做的就是模拟鼠标和键盘来操作这些元素,点击,输入等等,操作这些元素前首先要找到他们,webdriver提供很多定位元素的方法。

以下有6种方法

1.通过id来找到对象


button = browser.find_element_by_id(‘su’)

2.根据标签属性的属性值来找到对象


button = browser.find_element_by_class_name(‘wd’)

3.根据xpath语句来获取对象


button = browser.find_element_by_xpath(‘//input[@id=“su”]’)

4.根据bs4语法来获取对象


button = browser.find_element_by_css_selector(‘#su’)

5.根据标签名字来获取对象


button = browser.find_element_by_tag_name(‘input’)

6.通过当前页面中的链接文本来获取对象


button = browser.find_element_by_link_text(‘新闻’)

(五)selenium访问元素信息

====================================================================================

1.获取元素属性的属性值


.get_attribute(’’)

button = browser.find_element_by_id(‘su’)

content = button.get_attribute(‘class’)

print(content)

运行结果

2.获取标签名


.tag_name

button = browser.find_element_by_id(‘su’)

content = button.tag_name

print(content)

运行结果

3.获取元素文本


.text

button = browser.find_element_by_link_text(‘新闻’)

content = button.text

print(content)

运行结果

(六)selenium中的交互

==================================================================================

1.点击


click()

2.输入


send_keys()

3.后退操作


browser.back

4.前进操作


browser.forword()

5.模拟js滚动


move = document.documentElement.scrollTop=‘100000’

执行move代码

browser.execute_script(move)

6.获取网页代码


page_source

7.退出


browser.quit()

实例

=====================================================================

from selenium import webdriver

import time

path = ‘chromedriver.exe’

browser = webdriver.Chrome(path)

url = ‘https://baidu.com’

browser.get(url)

input = browser.find_element_by_id(‘kw’)

input.send_keys(‘钢铁是怎样炼成的’)

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里无偿获取


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号