请求网站并提取数据的“自动化”程序
1、通用网络爬虫:百度、谷歌
2、聚焦爬虫
3、增量爬虫
4、深层爬虫
Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。
1、客户端:上网的用户,例如:逛淘宝的我们
2、服务端:提供网站的商家,例如:阿里巴巴
逛网站的流程:
1、客户端 向 服务器 发送请求
2、服务器收到请求后,返回一个响应
其中: 客户端就是我们电脑上的浏览器软件,网址相当于目标服务器。服务器本质是别人的电脑的一个软件
3、请求:由客户端发送到服务器的一个信息,用于申请网页
4、响应:由服务器返回到客户端的一个信息,一般是网页,字符串,图片,音乐等内容
摘自:https://blog.csdn.net/qq_40949713/article/details/80512339#commentBox
python是所有编程语言中模块最丰富的
生活中常见的二维码功能在使用python第三方库来生成十分容易
安装导入QRCode
安装导入myqr库:
QRCode 多种自定义方法
实现代码
另外需要注意,你的动图需要跟你现在操作的py是在同一个文件夹
python myqr 模块 制作 静态 动态 二维码
请编写一个爬虫程序,爬取100张狗狗图片(网站不限,注意分页操作)