看小说广告太多了,遂写了爬虫抓取该小说,然后在手机上的阅读器上阅读,看到有几个小星星,所以就不断完善吧
大家都知道,在小说网站看小说总是各种广告,想要下载小说然而却要么需要钱,要么需要会员,如此,我们不妨写一个小说爬虫,将网页上的小说内容章节全部抓取下来,整理成为一本完整的txt文件,这样岂不是一件很愉快的事情!
说明
其实没想到大家对于这种爬取小说的还比较感兴趣,那么接下来会对这个爬虫持续优化 -2018-04-23
- 多线程
- 多进程
- 增加常见反爬虫机制绕过
- 错误异常抛出
- 增加程序稳定性
- 完成整个小说网站的download 并 添加到数据库
2018-06-21 更新 V1.2
- 在1.1版本的基础上增加了异常抛出,更加稳定;
- 去掉标题重复抓取的BUG;
- 非递归调用,优化程序运行效率,占用内存极小;
- 速度明显提升。
开源地址
版权声明:《 [爬虫项目] Novel_spider 》为DYBOY原创文章,转载请注明出处!
最后编辑:2018-6-23 21:06:46