分享好友 最新动态首页 最新动态分类 切换频道
python爬虫从0到1 -selenium的基本使用
2024-12-26 06:57

print(content)

python爬虫从0到1 -selenium的基本使用

(四)selenium的元素定位

===================================================================================

元素定位即自动化要做的就是模拟鼠标和键盘来操作这些元素,点击,输入等等,操作这些元素前首先要找到他们,webdriver提供很多定位元素的方法。

以下有6种方法

1.通过id来找到对象


button = browser.find_element_by_id(‘su’)

2.根据标签属性的属性值来找到对象


button = browser.find_element_by_class_name(‘wd’)

3.根据xpath语句来获取对象


button = browser.find_element_by_xpath(‘//input[@id=“su”]’)

4.根据bs4语法来获取对象


button = browser.find_element_by_css_selector(‘#su’)

5.根据标签名字来获取对象


button = browser.find_element_by_tag_name(‘input’)

6.通过当前页面中的链接文本来获取对象


button = browser.find_element_by_link_text(‘新闻’)

(五)selenium访问元素信息

====================================================================================

1.获取元素属性的属性值


.get_attribute(’’)

button = browser.find_element_by_id(‘su’)

content = button.get_attribute(‘class’)

print(content)

运行结果

2.获取标签名


.tag_name

button = browser.find_element_by_id(‘su’)

content = button.tag_name

print(content)

运行结果

3.获取元素文本


.text

button = browser.find_element_by_link_text(‘新闻’)

content = button.text

print(content)

运行结果

(六)selenium中的交互

==================================================================================

1.点击


click()

2.输入


send_keys()

3.后退操作


browser.back

4.前进操作


browser.forword()

5.模拟js滚动


move = document.documentElement.scrollTop=‘100000’

执行move代码

browser.execute_script(move)

6.获取网页代码


page_source

7.退出


browser.quit()

实例

=====================================================================

from selenium import webdriver

import time

path = ‘chromedriver.exe’

browser = webdriver.Chrome(path)

url = ‘https://baidu.com’

browser.get(url)

input = browser.find_element_by_id(‘kw’)

input.send_keys(‘钢铁是怎样炼成的’)

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里无偿获取

最新文章
淘宝关键词排名优化怎么做?影响因素有哪些?
标题是淘宝店铺自然搜索流量最重要的入口,如果宝贝的标题没有做好,那么后续的运营也就没有什么意义了。想要获取自然搜索流量,那么标题的关键词就得有权重,有排名。一、淘宝标题关键词如何优化靠前?首先,搜索引擎会先抓取大热词,大热
转:Sql 四大排名函数(ROW_NUMBER、RANK、DENSE_RANK、NTILE)简介
https://www.cnblogs.com/52xf/p/4209211.html    附上表结构和初始数据图:用法: 一:语法(用法):      rank() over([partition by col1] order by col2)      dense_rank() over([partition by col
苹果手机请启用javascript,请启用javascript教程
JavaScript是一种广泛应用于网页开发的脚本语言,它为网页增加了交互性和动态功能。如果您想在手机上开发和运行JavaScript代码,您需要确保手机浏览器支持JavaScript并已启用该功能Deepl降重。下面是一些简单的步骤,帮
美国男篮历史上有哪些巨星
1、迈克尔·乔丹迈克尔·乔丹,全球最具影响力的篮球运动员,也是世界上最伟大的篮球运动员,球迷们送了他一个外号“篮球之神”,可见乔丹在篮球运动中的影响力。曾在1984年和1992年两次带队参加奥运会,最终两次均以全胜战绩夺取金牌。2、
竞价推广之SEMer如何快速做好竞争对手分析?
俗话说,知己知彼百战不殆。且它在一定程度上决定了我们的推广策略以及账户优化方向。那么,小编想问你:对于你的竞争对手,你了解多少?日常你又会针对竞争对手做哪些分析?我想对于大多数人来说,都是一时兴起点击一下广告,并没有一定的目
赵丽颖黑粉的行为,深度分析与反思_反馈记录和整理
摘要:本文关注赵丽颖黑粉的行为,对其进行了深度分析与反জ
阿里云盘的几个资源搜索平台(应有尽有)
Kafka是一个分布式流处理平台,它具有高吞吐量、可扩展性和容错性的特点。下面是Kafka代码分析的一般步骤:1. 了解Kafka的基本概念和架构:在进行代码分析之前,首先需要了解Kafka的基本概念,例如topic、partition、producer、consumer等
漫蛙漫画app下载
漫蛙漫画app是一款热门的手机漫画资源app。软件上的漫画资源都是免费的,各种类型的题材应有尽有,感兴趣的小伙伴快来下载漫蛙漫画app体验吧!一款提供超多优质彩漫的追漫平台,这里的动漫资源非常的丰富,每天都会更新大量的高清动漫,各
计算器软件大全 热门计算器软件排行
探索科技助手:深入解析计算器软件大全 热门计算器软件排行,为你揭示当前最热门的计算工具,无论是日常生活中的简单加减,还是专业复杂的运算需求,一文带你领略高效便捷的数字生活。从排行榜单中挑选最适合你的那款神器,提升工作学习效
相关文章
推荐文章
发表评论
0评