douban_qrs

采集豆瓣前任3影评数据探索其票房大卖的原因

采集过程中出现的问题是前任三影评公4w多条,豆瓣只公开前500条

另外采集过程中采集200条数据需要登录,这里加了验证码登录的过程而douban_other.py中添加了scrapy的加cookie的用法

配置start.py运行即可也可在终端输入scrapy crawl douban

最后：本想找一张至尊宝的图片做词云图,奈何图片效果不理想.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
douban_qrs		douban_qrs
.gitignore		.gitignore
README.md		README.md
scrapy.cfg		scrapy.cfg
start.py		start.py

Provide feedback