基于关键词搜索结果的微博爬虫,主要按天抓取了博主昵称、博主主页、微博内容、微博地址、发布时间、发布来源、转发、评论、赞9项。
主要实现分时爬取。原来的代码时间间隔是天,做部分修改,新增代码时间做到了小时为间隔
使用selenium进行数据抓取的代码
selenium
使用模拟登录的代码,多天的数据保存在一个sheet里