首先 我们要爬的网址是:PPT模板下载_PPT模板免费下载_幻灯片模板下载 -【优品PPT】
在浏览器地址栏输入这个网址访问进去,里面有很多PPT模板
我们随机点击一个进去,再点击下载 ,如图
我们拿一下下载页面的网址可爱卡通小猪佩奇PPT模板 - 优品PPT
然后点击下载,会跳转一个网址
紧接着,我们点击下载地址1或下载地址2,会直接下载
首先先导入我们的requests 模块 -----需安装
紧接着写入代码
最基本的请求网址获取数据
然后就是我们的提取数据
采用正则表达式提取数据 -------导入正则模块 import re
data =re.findall('href="/article/.*?/(.*?).html"', res.text)
拿到我们的下载网址的id,并用for循环遍历(为什么用for循环),因为re提取出来的是一个列表数据。
用正则表达式提取
在把id拼接到我们的下载网址后面(注意是下载网址,不是首页的网址)
可爱卡通小猪佩奇PPT模板 - 优品PPT
然后请求我们的这个网址的到https://down.ypppt.com/uploads/soft/240909/1-240Z91R306.pptx
接下来就是保存数据
下面就是完整代码