This is a house rental information crawler project for people living in Beijing. Currently no other language documents are available, Chinese documents only.
适用人群:北京,有一定程序基础人群
最近为了抓取个人房东的出租信息,写了一个爬虫,用来整合水木清华租房版,以及豆瓣北京租房小组里面相关的租房信息,方便自己查看信息,不用每次都去搜索相关内容
- 可以配置租房区域
- 可以配置黑名单
- 可以配置帖子开始时间
抓取结果示意图:
Python 2.7+,暂时不支持Python 3
需要先安装pip依赖管理工具
需要先安装Requests以及BeautifulSoup库,如果已经安装可以忽略,没有安装,使用以下命令安装:
pip install requests
pip install beautifulsoup4
运行步骤:
由于豆瓣有反刷机制,每天运行次数不要过多,有可能导致当天无法获取数据,也就是引发403错误
豆瓣数据请求目前为每获得一次结果暂停1s
可通过以下地址提交 https://github.com/waylife/RentCrawer/issues/new
欢迎各路大神提供改进意见
The MIT license.