weibo_crawler

基于关键词搜索结果的微博爬虫,主要按天抓取了博主昵称、博主主页、微博内容、微博地址、发布时间、发布来源、转发、评论、赞9项。

新增代码

主要实现分时爬取。原来的代码时间间隔是天,做部分修改,新增代码时间做到了小时为间隔

weibo_search_selenium

使用selenium进行数据抓取的代码

weibo_search

使用模拟登录的代码,多天的数据保存在一个sheet里