众所周知,蒲公英是小红书推出的优质创作者商业合作服务平台,致力于为品牌和博主提供内容合作服务,可以高效的为品牌匹配出最符合的优质博主。
上面是筛选条件,下面是筛选结果。
共爬取到34个字段,字段如下:
详细演示数据:(看《蒲公英》这个sheet页)
https://docs.qq.com/sheet/DVEFhZlFKR1NXVEdN?tab=suenot
软件操作演示视频:【爬虫软件】批量采集小红书蒲公英博主信息
重要说明,请详读:
- Windows用户可直接双击打开使用,无需Python运行环境,非常方便!
- 需要在cookie.txt中填入cookie值,持久存储,方便长期使用
- 支持筛选笔记搜索关键词、笔记类型(不限/图文笔记为主/视频笔记为主)、粉丝数量、图文报价、搜索页范围。其他个性化筛选条件,可以和我沟通定制
- 爬取过程中,有log文件详细记录运行过程,方便回溯
- 爬取过程中,自动保存结果到csv文件(每爬一条存一次,防止数据丢失)
- 可爬34个关键字段,含:关键词,页码,小红书昵称,小红书号,地址,机构,数据更新至,小红书链接,粉丝数,账号类型,图文报价,视频报价,合作笔记数,预估阅读单价_图文,图文3秒阅读,日常_阅读中位数,日常_互动中位数,日常_阅读来源发现页占比,日常_阅读来源搜索页占比,合作_阅读中位数,合作_互动中位数,合作_阅读来源发现页占比,合作_阅读来源搜索页占比,女性粉丝占比,年龄占比最多的,账号评估,合作笔记1阅读数,合作笔记2阅读数,合作笔记3阅读数,合作笔记4阅读数,合作笔记5阅读数,合作笔记6阅读数,合作笔记7阅读数,合作笔记8阅读数。
- 以上爬取字段已经包含,如无法满足个性化要求,可定制开发(接口已调通)
以上。
由于采集字段较多,开发者模式中分析接口不止一个,采集程序整合多个接口开发而成,归纳如下:
- 博主列表接口
- 日常笔记接口
- 合作笔记接口
- 粉丝数接口
- 阅读单价接口
- 合作笔记阅读数接口
- 所属机构接口
以上。
此软件开发成本较高,代码量大、实现逻辑复杂,为保护个人知识版权,防止恶意盗版软件,不展示爬虫核心代码。
主窗口部分:
部分界面控件:
日志输出控件:
好的日志功能,方便软件运行出问题后快速定位原因,修复bug。
核心代码:
完整exe采集软件,微信公众号"老男孩的平凡之路"后台回复"爬蒲公英"即可获取。点击直达