一、zkdoctor是什么

zkdoctor是一个ZooKeeper服务的统计、监控报警以及自动化运维平台:监控ZooKeeper集群运行状态,做到有问题及时发现、及时解决,掌握ZooKeeper整体运行情况。主要包括:

六、功能点描述

1、集群管理

1)集群信息定时采集、展示、定时清除统计数据功能

每个集群信息采集任务分别独立,任务频率:1分钟。通过四字命令获取服务端数据,再进行解析存储

2)节点的增删改查功能

连接leader节点,完成相关节点操作

3)集群一键添加

集群添加成功后,将自动开启集群监控定时任务

2、集群运维

1)服务的自动化部署功能

提供安装包下载路径,以及安装服务必须进行的配置信息,可以一键部署集群服务

2)动态扩容功能

提供新机器信息以及必须的配置信息,可以一键扩容

3)服务下线功能

停止集群中所有实例的服务

4)服务重启功能

逐台重启,完成整个集群的重启过程

5)实例的添加与移除功能

手动完成实例的添加与移除,维护集群结构

6)实例下线、重启功能

单台服务下线、重启

7)配置更改、新配置文件推送功能

主要用于配置的更新,myid配置文件推送等

8)服务升级

提供待升级的jar文件,可完成原jar文件备份、新jar文件推送,并重启服务的功能。适用于服务端二次开发升级的情况

3、监控报警

1)集群运行状态监控、报警功能

2)实例运行状态监控、报警功能

2)机器运行状态监控、报警功能

4、机器管理

1)机器信息定时采集、展示、定时清除统计数据功能

2)机器的新增、修改等功能

3)SSH功能

5、Quartz管理

1)定时任务的删除、停止功能

6、用户管理

1)登录支持两种模式:

Reister:用户注册登录,采用密文存储密码信息。用户注册后进行登录

LDAP:直接用户名密码登录即可

2)用户信息的增删改查功能

3)用户权限控制功能

主要包含3种角色:普通用户、管理员用户以及超级管理员用户。超级管理员拥有报警信息直接送达,无需配置的权限

七、问题反馈

目前有关zkdoctor的问题交流方式有如下几种,欢迎加入进行技术讨论:

1、报告issue:[issues] (https://github.com/ucarGroup/zkdoctor/issues)

2、qq交流群: 824123986