streaming-offset-to-zk

项目背景

公司有一个比较核心的实时业务用的是spark streaming2.1.0+kafka0.9.0.0的流式技术来开发的，存储用的hbase+elasticsearch+redis，这中间趟过很多坑，解决了一些bug和问题，在这里我把它做成了一个骨架项目并开源出来，希望后来的朋友可以借阅和参考，尽量少走些弯路，当然如果中间遇到或者发现什么问题都可以给我提issue。

下面是使用过程中记录的一些心得和博客，感兴趣的朋友可以了解下：

（1）spark streaming自带的checkpoint容错使用

（2）spark streaming自带的checkpoint的弊端

（3）如何管理spark streaming消费Kafka的偏移量（一）

（4）如何管理spark streaming消费Kafka的偏移量（二）

（5）如何管理spark streaming消费Kafka的偏移量（三）

（6）spark streaming程序如何优雅的停止服务（一）

（7）spark streaming程序如何优雅的停止服务（二）

（8）spark streaming程序如何优雅的停止服务（三）