由于以前公众号发了挺多分享资源的文章,索性写个python爬虫来爬取
特点:
1.保留公众号排版样式(就是把div样式全拷下来了)
2.写成md格式,并且加了hexo渲染需要的头部
3.解除了微信图片防盗链的限制!!!
不过一次只能抓一篇文章(不过我是因为之前公众号有一篇文章发了链接合集,所以直接全都下载了)
脚本放在GitHub练习库里
将公众号文章爬到hexo博客下面是抓取单篇的python
1 |
|
由于以前公众号发了挺多分享资源的文章,索性写个python爬虫来爬取
特点:
1.保留公众号排版样式(就是把div样式全拷下来了)
2.写成md格式,并且加了hexo渲染需要的头部
3.解除了微信图片防盗链的限制!!!
不过一次只能抓一篇文章(不过我是因为之前公众号有一篇文章发了链接合集,所以直接全都下载了)
脚本放在GitHub练习库里
将公众号文章爬到hexo博客下面是抓取单篇的python
1 |
|
我是小鸡,这篇文章的标题是——将公众号文章爬到hexo博客
喜欢的话可以转载,不过记得标记出处
2018年11月22日