以前一直使用的php作为爬虫,因为量不大,php也比较熟悉,写起来比较快。最近初识Python,趁机研究了一下Scrapy,结合angularjs实现豆瓣阅读器使用。
在Ubuntu里搭建Python环境很让人蛋疼,其他的自己摸索吧,我强调一点就是运行Crawl时报错:Scrapy gives URLError:
附上GitHub地址
https://github.com/zhoufanqq/doubanReaderCrawl
以前一直使用的php作为爬虫,因为量不大,php也比较熟悉,写起来比较快。最近初识Python,趁机研究了一下Scrapy,结合angularjs实现豆瓣阅读器使用。
在Ubuntu里搭建Python环境很让人蛋疼,其他的自己摸索吧,我强调一点就是运行Crawl时报错:Scrapy gives URLError:
附上GitHub地址
https://github.com/zhoufanqq/doubanReaderCrawl