Skip to content

ReainL/douban_qrs

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

douban_qrs

采集豆瓣前任3影评数据探索其票房大卖的原因

采集过程中出现的问题是前任三影评公4w多条,豆瓣只公开前500条

另外采集过程中采集200条数据需要登录,这里加了验证码登录的过程 而douban_other.py中添加了scrapy的加cookie的用法

配置start.py运行即可也可在终端输入scrapy crawl douban

最后:本想找一张至尊宝的图片做词云图,奈何图片效果不理想.

About

采集豆瓣前任3影评数据探索其票房大卖的原因

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages