Zookeeper一个分布式协调框架,是Apache Hadoop
的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等
核心概念
一个用于存储少量数据的基于内存的数据库,主要有如下两个核心的概念:文件系统数据结构+监听通知机制。
文件系统数据结构
- PERSISTENT-持久化目录节点
客户端与Zookeeper断开连接后,该节点依旧存在,只要不手动删除该节点,他将永远存在 - PERSISTENT_SEQUENTIAL-持久化顺序编号目录节点
客户端与Zookeeper断开连接后,该节点依旧存在,只是Zookeeper给该节点名称进行顺序编号 - EPHEMERAL-临时目录节点
客户端与Zookeeper断开连接后,该节点被删除 - EPHEMERAL_SEQUENTIAL-临时顺序编号目录节点
客户端与Zookeeper断开连接后,该节点被删除,只是Zookeeper给该节点名称进行顺序编号 - Container 节点(3.5.3 版本新增,如果Container节点下面没有子节点,则Container节点在未来会被Zookeeper自动清除,定时任务默认60s 检查一次)
- TTL 节点( 默认禁用,只能通过系统配置
zookeeper.extendedTypesEnabled=true
开启,不稳定)
监听通知机制
客户端注册监听它关心的任意节点,或者目录节点及递归子目录节点
如果注册的是对某个节点的监听,则当这个节点被删除,或者被修改时,对应的客户端将被通知
如果注册的是对某个目录的监听,则当这个目录有子节点被创建,或者有子节点被删除,对应的客户端将被通知
如果注册的是对某个目录的递归子节点进行监听,则当这个目录下面的任意子节点有目录结构的变化(有子节点被创建,或被删除)或者根节点有数据变化时,对应的客户端将被通知。
注:所有的通知都是一次性的,及无论是对节点还是对目录进行的监听,一旦触发,对应的监听即被移除。递归子节点,监听是对所有子节点的,所以,每个子节点下面的事件同样只会被触发一次。
Zookeeper安装
配置JAVA环境,检验环境:
1
java -version
下载解压 Zookeeper
1
wget https://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.5.8/apache-zookeeper-3.5.8-bin.tar.gz tar -zxvf apache-zookeeper-3.5.8-bin.tar.gz cd apache-zookeeper-3.5.8-bin
重命名配置文件
zoo_sample.cfg
1
cp zoo_sample.cfg zoo.cfg
启动Zookeeper
1
2
3可以通过 bin/zkServer.sh 来查看都支持哪些参数
进入安装目录
bin/zkServer.sh start conf/zoo.cfg检测是否启动成功
1
2
3echo stat | nc 192.168.109.200 // 前提是配置文件中中讲 stat 四字命令设置了了白名单 如: 4lw.commands.whitelist=stat
或使用
ps -ef | grep zookeeper连接服务器
1
bin/zkCli.sh -server ip:port
命令行操作Zookeeper
命令 help 查看Zookeeper所支持的所有命令:
1 | [zk: localhost:2181(CONNECTED) 80] help |
Zookeeper事件类型:
None: 连接建立事件
NodeCreated: 节点创建
NodeDeleted: 节点删除
NodeDataChanged:节点数据变化
NodeChildrenChanged:子节点列表变化
DataWatchRemoved:节点监听被移除
ChildWatchRemoved:子节点监听被移除
ACL 权限控制( Access Control List )
控制节点的读写操作,保证数据的安全性,Zookeeper ACL 权限设置分为 3 部分组成,分别是:权限模式(Scheme)、授权对象(ID)、权限信息(Permission)
Scheme(权限模式):用来设置 Zookeeper 服务器进行权限验证的方式。
一种是范围验证。所谓的范围验证就是说 Zookeeper 可以针对一个 IP 或者一段 IP 地址授予某种权限。比如我们可以让一个 IP 地址为ip:192.168.0.110
的机器对服务器上的某个数据节点具有写入的权限。或者也可以通过ip:192.168.0.1/24
给一段 IP 地址的机器赋权。
另一种是口令验证,也可以理解为用户名密码的方式。在 Zookeeper 中这种验证方式是 Digest 认证,而 Digest 这种认证方式首先在客户端传送username:password
这种形式的权限表示符后,Zookeeper 服务端会对密码 部分使用 SHA-1
和 BASE64
算法进行加密,以保证安全性。
还有一种Super权限模式, Super可以认为是一种特殊的 Digest 认证。具有 Super 权限的客户端可以对 Zookeeper 上的任意数据节点进行任意操作。
授权对象(ID)
授权对象就是说我们要把权限赋予谁,而对应于 4 种不同的权限模式来说,如果我们选择采用 IP 方式,使用的授权对象可以是一个 IP 地址或 IP 地址段;而如果使用 Digest 或 Super 方式,则对应于一个用户名。如果是 World 模式,是授权系统中所有的用户。
权限信息(Permission)
权限就是指我们可以在数据节点上执行的操作种类,如下所示:在 Zookeeper 中已经定义好的权限有 5 种:
数据节点(c: create)创建权限,授予权限的对象可以在数据节点下创建子节点;
数据节点(w: wirte)更新权限,授予权限的对象可以更新该数据节点;
数据节点(r: read)读取权限,授予权限的对象可以读取该节点的内容以及子节点的列表信息;
数据节点(d: delete)删除权限,授予权限的对象可以删除该数据节点的子节点;
数据节点(a: admin)管理者权限,授予权限的对象可以对该数据节点体进行 ACL 权限设置。
通过系统参数zookeeper.skipACL=yes
进行配置,默认是no,可以配置为true, 则配置过的ACL将不再进行权限检测
生成授权ID
A-代码生成ID:
1 |
|
B-在x shell 中生成:
1 | echo -n <user>:<password> | openssl dgst -binary -sha1 | openssl base64 |
设置ACL
1 | 节点创建的同时设置ACL |
Zookeeper 内存数据和持久化
数据的组织形式为一个类似文件系统的数据结构,而这些数据都是存储在内存中的,所以我们可以认为,Zookeeper是一个基于内存的小型数据库
1 | // 内存中的数据: |
...
...
Copyright 2021 sunfy.top ALL Rights Reserved