写在前边
1)先说问题:大概去年某个时间在微信上看过一篇文章,当时候觉得有意思,但是没有收藏;只记得几个关键字,想用微信直接搜,结果又太多了;就…「想得却不可得,你奈人生何?」
2)好在搜狗可以搜微信文章,大概是这样,就想试着用程序爬一下:
3)结论:方法是成功了,结果却没有拿到,原因在于搜狗搜索貌似没有检索到这篇文章(叹气),就简单记录下爬取的方法吧。
代码
1 | import sys |
写在后边
1)上边的脚本还是有些问题,比如如果短时间翻页太多,会让你输验证码;拿到的链接其实不是真实公众号文章的链接,需要再做一下处理,时间关系,我就没有实现,相应的一些解决办法在参考链接里;
2)看到好的文章,句子啊,记得平时做好记录;
参考链接
https://blog.csdn.net/m0_46521785/article/details/113776386
https://www.pythonf.cn/read/129313
https://segmentfault.com/a/1190000023622107