分享好友 最新动态首页 最新动态分类 切换频道
python 获取微信公众号用户信息 python微信公众号爬虫
2024-12-26 15:58


python 获取微信公众号用户信息 python微信公众号爬虫

有时候公众号文章需要进行整理分析,要把所有文章的链接整合起来还真不是一个容易的事情!手动整理固然简单,但文章数量多起来整理还真不是一件容易的事情。

这个时候我们可以用到神器Python,定制爬虫的指定“装备”!

我们知道,微信公众号的文章链接都是做了隐藏的,一般爬虫无法抓取,我们应该怎么办呢?

没有真实链接

我们需要通过抓包提取公众号文章的请求的 URL,此次我们以Charles为例子,勾选抓取电脑请求, 默认就是勾选的,不改动即可!

默认勾选

过滤掉无关请求,我们指抓取微信的域名,可以在软件下方设置要抓取的域名具体如图所示!

微信mp开头的域名

打开“新睿云”的微信公众号的文章列表后,Charles 就会抓取到大量的请求,找到我们需要的文章标题与链接,在JSON返回的信息里面包含了文章的标题、链接、信息等等。

返回文章标题与链接

这些都是请求链接后的返回,请求链接 url 我们可以在 Overview 中查看。

Overview

抓包抓到这么多,下面我们就可以进行对标题与链接的提取了!

初始化函数

我们通过对抓包的信息进行分析后,则可以使用requests 库来进行请求,对返回的值进行判断!如果返回是是整形200则说明一切正常,我们再构建parse_data()函数来进行解析我们所需要的信息。

提取数据

通过刚才Json的分析,我们则能看到需求的数据均在appmsgext_info 下面。

提取数据

我们用 json.loads 解析返回的 Json 信息,把我们需要的列保存在 csv 文件中,有标题、摘要、文章链接三列信息,其他信息也可以自己加。

当爬虫运行完毕后,则效果如下:

结果展示

剩下的就是整合分类的问题了,这就要看你自己喽!

最新文章
2023抖音巨量引擎广告账户怎么开通
自从巨量引擎作为字节跳动的营销服务品牌被发布之后,巨量引擎相关话题就一度成为广告主和品牌商为关心的事情。但是依然还有很多同学通过后台留言咨询巨量引擎账户的问题,因此我专门请了厚昌学院的柯南老师来为大家讲解巨量引擎到底怎么玩
335期[逍遥小妖]排五013路名家分析
体彩中心排列五本期开奖号码:74681013路比1:3:10路奖号分析本期开出的0路奖号有8。近30期0路奖号共出现28个,占比32%,整体走势平稳接近平均值。。最近一周内开出7枚。占比34%,上期0路开出1枚,最近一周0路号码表现较弱,后续关注回升走势
2024新手开无货源淘宝店铺需要多少资金投入?
新手开无货源淘宝店铺需要多少资金投入?我曾经做统计,单纯的开个淘宝店,花不了多少钱:1、开店资金:消费者保证金,只要缴纳保证金之后就可以发布产品。消费者保证金,大部分类目都是1000元,部分类目3000或者5000元。消费者保证金可以
AI攻占诺奖背后:新的技术革命成为社会进步发展的重要引擎
  “超越人类智慧的AI可以用语言操纵我们,或许会试图说服我们不要关掉开关。”  今年3月,由ChatGPT掀起的AI(人工智能)技术革命背后的奠基性科学家、被誉为“AI教父”的杰弗里·辛顿(Geoffrey E. Hinton),曾对媒体提及他对AI“反噬人
AI面试“魔法对轰”风起?有银行应聘考生寻求“外挂”门道
  在求职黄金季的班车上,招聘已经成了AI之间的“魔法对轰”。前段时间,XAI联合创始人Greg Yang发文称,有求职者在他的直播面试中使用AI作弊,引发了大量关注,就连马斯克也现身评论区,贡献了一句经典的“Interesting”。  如今,数
Gitee + Typora,搭建你的免费高速图床
一个 Gitee 账号 是的,就这么简单,只要你有一个 Gitee 账号就够了,你就能拥有一个免费的图床了,如果你还没有,那赶紧出门去 注册 一个账号吧。 3. 搭建过程接下来就是正式开始搭建过程了,准备好
2024年上海水利工程监理加盟设立分公司的标准+2024top5水利工程监理加盟榜单汇总
2024年上海水利工程监理加盟设立分公司的标准+2024top5水利工程监理加盟榜单汇总
12月13日自动化设备行业十大熊股一览
证券之星消息,12月13日,沪指报收3391.88,较前一交易日下跌2.01%。自动化设备行业整体表现较弱,较前一交易日下跌2.14%,10只个股上涨,69只个股下跌。个股表现方面,自动化设备行业当日领跌股为华昌达(300278),该股当日报收7.54,下
AI时代的程序员生存指南:如何在变革中保持并提升核心竞争力?
随着AIGC(如chatgpt、midjourney、claude等)大语言模型接二连三的涌现,AI辅助编程工具日益普及,程序员的工作方式正在发生深刻变革。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作&
12月10日晚间公告集锦:宁德时代拟向全体股东每10股派发现金分红12.3元
  12月10日晚间,沪深两市多家上市公司发布公告,供投资者参考:  重大事项  宁德时代:拟向全体股东每10股派发现金分红12.3元  ()公告,公司拟以2024年前三季度合并报表中归属于上市公司股东的净利润的15%即54亿元作为分配总额
相关文章
推荐文章
发表评论
0评