zookeeper简介与安装使用
zookeeper是什么
官方文档上这么解释zookeeper,它是一个分布式服务框架,是Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。
上面的解释有点抽象,简单来说zookeeper=文件系统+监听通知机制。
文件系统
Zookeeper维护一个类似文件系统的数据结构:
每个子目录项如 NameService 都被称作为 znode(目录节点),和文件系统一样,我们能够自由的增加、删除znode,在一个znode下增加、删除子znode,唯一的不同在于znode是可以存储数据的。
有四种类型的znode:
- PERSISTENT-持久化目录节点
客户端与zookeeper断开连接后,该节点依旧存在
- PERSISTENT_SEQUENTIAL-持久化顺序编号目录节点
客户端与zookeeper断开连接后,该节点依旧存在,只是Zookeeper给该节点名称进行顺序编号
- EPHEMERAL-临时目录节点
客户端与zookeeper断开连接后,该节点被删除
- EPHEMERAL_SEQUENTIAL-临时顺序编号目录节点
客户端与zookeeper断开连接后,该节点被删除,只是Zookeeper给该节点名称进行顺序编号
监听通知机制
客户端注册监听它关心的目录节点,当目录节点发生变化(数据改变、被删除、子目录节点增加删除)时,zookeeper会通知客户端。
Zookeeper能做什么
zookeeper功能非常强大,可以实现诸如分布式应用配置管理、统一命名服务、状态同步服务、集群管理等功能,我们这里拿比较简单的分布式应用配置管理为例来说明。
假设我们的程序是分布式部署在多台机器上,如果我们要改变程序的配置文件,需要逐台机器去修改,非常麻烦,现在把这些配置全部放到zookeeper上去,保存在 zookeeper 的某个目录节点中,然后所有相关应用程序对这个目录节点进行监听,一旦配置信息发生变化,每个应用程序就会收到 zookeeper 的通知,然后从 zookeeper 获取新的配置信息应用到系统中。
Zookeeper单机模式安装
Step1:创建zookeeper用户和组
1
2[root@localhost ~]# groupadd zookeeper
[root@localhost ~]# useradd zookeeper -g zookeeperStep2:配置JAVA环境,检验环境:java -version
1
2
3
4[zookeeper@localhost ~]$ java -version
openjdk version "1.8.0_232"
OpenJDK Runtime Environment (build 1.8.0_232-b09)
OpenJDK 64-Bit Server VM (build 25.232-b09, mixed mode)Step3:下载并解压zookeeper
1
2
3
4[zookeeper@localhost ~]$ cd ~
[zookeeper@localhost ~]$ wget https://downloads.apache.org/zookeeper/zookeeper-3.6.0/apache-zookeeper-3.6.0-bin.tar.gz
[zookeeper@localhost ~]$ tar zxvf apache-zookeeper-3.6.0-bin.tar.gz
[zookeeper@localhost ~]$ cd apache-zookeeper-3.6.0-bin/Step4:重命名配置文件zoo_sample.cfg
1
[zookeeper@localhost apache-zookeeper-3.6.0-bin]$ cp conf/zoo_sample.cfg conf/zoo.cfg
Step5:启动zookeeper
1
[zookeeper@localhost apache-zookeeper-3.6.0-bin]$ bin/zkServer.sh start
Step6:检测是否成功启动,用zookeeper客户端连接下服务端
1
[zookeeper@localhost apache-zookeeper-3.6.0-bin]$ bin/zkCli.sh
Zookeeper使用
使用客户端命令操作zookeeper
- 使用 ls 命令来查看当前 ZooKeeper 中所包含的内容
2. 创建一个新的 znode ,使用 create /zkTest myData
3. 再次使用 ls 命令来查看现在 zookeeper 中所包含的内容
4. 下面我们运行 get 命令来确认第二步中所创建的 znode 是否包含我们所创建的字符串
5. 下面我们通过 set 命令来对 zk 所关联的字符串进行设置
6. 查看刚才set的内容
7. 下面我们将刚才创建的 znode 删除
使用Java API操作zookeeper
使用Java API操作zookeeper需要引用下面的包
1 | <dependency> |
下面我们来实现上面说的分布式配置中心:
- 在zookeeper里增加一个目录节点,并且把配置信息存储在里面
2. 启动两个zookeeper客户端程序,代码如下所示
1 | import java.util.concurrent.CountDownLatch; |
两个程序启动后都正确的读取到了zookeeper的/username目录节点下的数据laosan
3. 我们在zookeeper里修改下目录节点/username下的数据
修改完成后,我们看见两个程序后台都及时收到了他们监听的目录节点数据变更后的值.
Zookeeper集群模式安装
Step1:创建zookeeper用户和组
1
2[root@localhost ~]# groupadd zookeeper
[root@localhost ~]# useradd zookeeper -g zookeeperStep2:配置JAVA环境,检验环境:java -version
1
2
3
4[zookeeper@localhost ~]$ java -version
openjdk version "1.8.0_232"
OpenJDK Runtime Environment (build 1.8.0_232-b09)
OpenJDK 64-Bit Server VM (build 25.232-b09, mixed mode)Step3:下载并解压zookeeper
1
2
3
4[zookeeper@localhost ~]$ cd ~
[zookeeper@localhost ~]$ wget https://downloads.apache.org/zookeeper/zookeeper-3.6.0/apache-zookeeper-3.6.0-bin.tar.gz
[zookeeper@localhost ~]$ tar zxvf apache-zookeeper-3.6.0-bin.tar.gz
[zookeeper@localhost ~]$ cd apache-zookeeper-3.6.0-bin/Step4:重命名配置文件zoo_sample.cfg
1
[zookeeper@localhost apache-zookeeper-3.6.0-bin]$ cp conf/zoo_sample.cfg conf/zoo-1.cfg
Step5:修改配置文件zoo-1.cfg,原配置文件里有的,修改成下面的值,没有的则加上
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20vim conf/zoo-1.cfg
The number of milliseconds of each tick
tickTime=2000
The number of ticks that the initial
synchronization phase can take
initLimit=10
The number of ticks that can pass between
sending a request and getting an acknowledgement
syncLimit=5
the directory where the snapshot is stored.
do not use /tmp for storage, /tmp here is just
example sakes.
dataDir=/home/zookeeper/apache-zookeeper-3.6.0-bin/data/zookeeper-1
dataLogDir=/home/zookeeper/apache-zookeeper-3.6.0-bin/datalog/zookeeper-1
the port at which the clients will connect
clientPort=2181
server.1=127.0.0.1:2888:3888
server.2=127.0.0.1:2889:3889
server.3=127.0.0.1:2890:3890配置说明
tickTime:这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。
initLimit:这个配置项是用来配置 Zookeeper 接受客户端(这里所说的客户端不是用户连接 Zookeeper 服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 10个心跳的时间(也就是 tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 10*2000=20 秒
syncLimit:这个配置项标识 Leader 与 Follower 之间发送消息,请求和应答时间长度,最长不能超过多少个 tickTime 的时间长度,总的时间长度就是 5*2000=10秒
dataDir:顾名思义就是 Zookeeper 保存数据的目录,默认情况下,Zookeeper 将写数据的日志文件也保存在这个目录里。
clientPort:这个端口就是客户端连接 Zookeeper 服务器的端口,Zookeeper 会监听这个端口,接受客户端的访问请求。
server.A=B:C:D:其中 A 是一个数字,表示这个是第几号服务器;B 是这个服务器的 ip 地址;C 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;D 表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于 B 都是一样,所以不同的 Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。
Step6:修改配置文件zoo-1.cfg,原配置文件里有的,修改成下面的值,没有的则加上
1
2[zookeeper@localhost apache-zookeeper-3.6.0-bin]$ cp conf/zoo-1.cfg conf/zoo-2.cfg
[zookeeper@localhost apache-zookeeper-3.6.0-bin]$ cp conf/zoo-1.cfg conf/zoo-3.cfg1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19The number of milliseconds of each tick
tickTime=2000
The number of ticks that the initial
synchronization phase can take
initLimit=10
The number of ticks that can pass between
sending a request and getting an acknowledgement
syncLimit=5
the directory where the snapshot is stored.
do not use /tmp for storage, /tmp here is just
example sakes.
dataDir=/home/zookeeper/apache-zookeeper-3.6.0-bin/data/zookeeper-2
dataLogDir=/home/zookeeper/apache-zookeeper-3.6.0-bin/datalog/zookeeper-2
the port at which the clients will connect
clientPort=2182
server.1=127.0.0.1:2888:3888
server.2=127.0.0.1:2889:3889
server.3=127.0.0.1:2890:38901
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19The number of milliseconds of each tick
tickTime=2000
The number of ticks that the initial
synchronization phase can take
initLimit=10
The number of ticks that can pass between
sending a request and getting an acknowledgement
syncLimit=5
the directory where the snapshot is stored.
do not use /tmp for storage, /tmp here is just
example sakes.
dataDir=/home/zookeeper/apache-zookeeper-3.6.0-bin/data/zookeeper-3
dataLogDir=/home/zookeeper/apache-zookeeper-3.6.0-bin/datalog/zookeeper-3
the port at which the clients will connect
clientPort=2183
server.1=127.0.0.1:2888:3888
server.2=127.0.0.1:2889:3889
server.3=127.0.0.1:2890:3890Step7:标识Server ID
创建三个文件夹/home/zookeeper/apache-zookeeper-3.6.0-bin/data/zookeeper-1,/home/zookeeper/apache-zookeeper-3.6.0-bin/data/zookeeper-2,/home/zookeeper/apache-zookeeper-3.6.0-bin/data/zookeeper-3,在每个目录中创建文件myid 文件,写入当前实例的server id,即1 、2 、3同时创建日志文件夹
1
2
3
4
5
6
7[zookeeper@localhost data]$ mkdir -p /home/zookeeper/apache-zookeeper-3.6.0-bin/data/zookeeper-1
[zookeeper@localhost data]$ mkdir -p /home/zookeeper/apache-zookeeper-3.6.0-bin/data/zookeeper-2
[zookeeper@localhost data]$ mkdir -p /home/zookeeper/apache-zookeeper-3.6.0-bin/data/zookeeper-3
[zookeeper@localhost conf]$ mkdir -p dataLogDir=/home/zookeeper/apache-zookeeper-3.6.0-bin/datalog/zookeeper-1
[zookeeper@localhost conf]$ mkdir -p dataLogDir=/home/zookeeper/apache-zookeeper-3.6.0-bin/datalog/zookeeper-2
[zookeeper@localhost conf]$ mkdir -p dataLogDir=/home/zookeeper/apache-zookeeper-3.6.0-bin/datalog/zookeeper-31
2
3[zookeeper@localhost data]$ echo 1 > zookeeper-1/myid
[zookeeper@localhost data]$ echo 2 > zookeeper-2/myid
[zookeeper@localhost data]$ echo 3 > zookeeper-3/myidStep8:启动三个zookeeper实例
1
2
3[zookeeper@localhost apache-zookeeper-3.6.0-bin]$ bin/zkServer.sh start conf/zoo-1.cfg
[zookeeper@localhost apache-zookeeper-3.6.0-bin]$ bin/zkServer.sh start conf/zoo-2.cfg
[zookeeper@localhost apache-zookeeper-3.6.0-bin]$ bin/zkServer.sh start conf/zoo-3.cfg
也可以直接用命令”zkCli.sh -server IP:PORT”连接zookeeper服务端检测
至此,我们对zookeeper就算有了一个入门的了解,当然zookeeper远比我们这里描述的功能多,比如用zookeeper实现集群管理,分布式锁,分布式队列,zookeeper集群leader选举等等