Codis集群部署实战

一、概要

1、折腾codis集群已经快两个月了,感谢一直以来codis的作者刘奇和黄东旭的耐心支持,在这里给你们点个赞,现在我司已经有一个业务跑在了codis集群上,目前只是切了整个业务的10%的量,预计下周会全量切到codis上,这个时候大家肯定特别想知道codis稳定吗?有没有什么bug啊,你想知道的也是我想知道的,搞起吧,用了才知道,反正目前我们这没发现啥问题,一些小的问题已经及时联系作者改掉了,好吧,不扯淡了,写这篇文章的目的是帮助想了解codis的初学者快速部署(官方的部署文档对应运维知识弱一点的童鞋看来还是有点费力)还有就是给自己做一个备录以便后期集群的部署。

2、Codis 是一个分布式 Redis 解决方案, 对于上层的应用来说, 连接到 Codis Proxy 和连接原生的 Redis Server 没有明显的区别 (有一些命令不支持), 上层应用可以像使用单机的 Redis 一样使用, Codis 底层会处理请求的转发, 不停机的数据迁移等工作, 所有后边的一切事情, 对于前面的客户端来说是透明的, 可以简单的认为后边连接的是一个内存无限大的 Redis 服务,当然,前段时间redis官方的3.0出了稳定版,3.0支持集群功能,codis的实现原理和3.0的集群功能差不多,我了解的现在美团、阿里已经用了3.0的集群功能了,我们这边的业务主要是php,3.0集群的sdk目前貌似还没有支持php语言的,大家谁的php应用上了3.0集群,请联系我,我去取经

二、架构

wKiom1U4wNbil8RQAAIeNjYHmcE992

三、角色分批

zookeeper集群:

10.10.0.47
10.10.0.48
10.10.1.76

codis-config、codis-ha:

10.10.32.10:18087

codis-proxy:

 10.10.32.10:19000
 10.10.32.49:19000

codis-server:

 10.10.32.42:6379、10.10.32.43:6380(主、从)
 10.10.32.43:6379、10.10.32.44:6380(主、从)
 10.10.32.44:6379、10.10.32.42:6380(主、从)

四、部署

1、安装zookeeper (3台 zookeeper server)

//新增host(3台 zookeeper server)
vim /etc/hosts
10.10.0.47 ZooKeeper-node1
10.10.0.48 ZooKeeper-node2
10.10.1.76 ZooKeeper-node3

//保存后执行,使配置生效
# source /etc/hosts
//安装Java环境(3台zookeeper server)
# yum install java-1.8.0-openjdk*

从官方镜像中下载 Zookeeper  http://mirror.bit.edu.cn/apache/zookeeper/

//将文件下载到
# cd /usr/local/ 
# wget http://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.4.6/zookeeper-3.4.6.tar.gz
# tar xzf zookeeper-3.4.6.tar.gz
# mv zookeeper-3.4.6.tar.gz zookeeper
#(3台 zookeeper server,同样操作)
# cp /usr/local/zookeeper/conf/zoo_sample.cfg zoo.cfg 
# vim /usr/local/zookeeper/conf/zoo.cfg ##撰写zk的配置文件

maxClientCnxns=50
tickTime=2000
initLimit=10
syncLimit=5
dataDir=/data/zookeeper/data/
dataLogDir=/data/zookeeper/log/
clientPort=2181
server.1=ZooKeeper-node1:2888:3888
server.2=ZooKeeper-node2:2888:3888
server.3=ZooKeeper-node3:2888:3888
//(3台 zookeeper server,同样操作)
//创建datDir 、dataLogDir的目录
# mkdir /data/zookeeper/{data,log}

//生成ID,这里需要注意, myid对应的zoo.cfg的server.ID,比如ZooKeeper-node2对应的myid应该是2
# echo "1" >/data/zookeeper/data/myid
//启动服务(3台 zookeeper server)
# /usr/local/zookeeper/bin/zkServer.sh start

2、go安装(codis是go语言写的,所以那些机器需要安装你懂得)

从中国官方下载:http://www.golangtc.com/download

wget http://www.golangtc.com/static/go/go1.4.2.linux-amd64.tar.gz
 tar -zxvf go1.4.1.linux-amd64.tar.gz
 mv go /usr/local/
 cd /usr/local/go/src/
 bash all.bash
 cat >> ~/.bashrc << _bashrc_export
 export GOROOT=/usr/local/go
 export PATH=\$PATH:\$GOROOT/bin
 export GOARCH=amd64
 export GOOS=linux
 _bashrc_export
 source ~/.bashrc

3、下载并编译codis(codis-config、codis-proxy、codis-server所在的机器)

mkdir /data/go
 export GOPATH=/data/go
 /usr/local/go/bin/go get github.com/wandoulabs/codis
 cd /data/go/src/github.com/wandoulabs/codis/
 ./bootstrap.sh
 make gotest

五、服务启动及初始化集群

1、启动 dashboard(codis-config上操作)

cat /etc/codis/config_10.ini ##撰写配置文件
 zk=10.10.0.47:2181,10.10.0.48:2181,10.10.1.76:2181
 product=zh_news
 proxy_id=codis-proxy_10
 net_timeout=5000
 proto=tcp4
 dashboard_addr=10.10.32.10:18087
cd /data/go/src/github.com/wandoulabs/codis/ && ./bin/codis-config -c /etc/codis/config_10.ini dashboard &

2、初始化 slots (codis-config上操作)

cd /data/go/src/github.com/wandoulabs/codis/ && ./bin/codis-config -c /etc/codis/config_10.ini slot init

3、启动 Codis Redis , 和官方的Redis Server参数一样(codis-server上操作)

cd /data/go/src/github.com/wandoulabs/codis/ && ./bin/codis-server /etc/redis_6379.conf &

4、添加 Redis Server Group , 每一个 Server Group 作为一个 Redis 服务器组存在, 只允许有一个 master, 可以有多个 slave, group id 仅支持大于等于1的整数(codis-config上操作)

cd /data/go/src/github.com/wandoulabs/codis/
 ./bin/codis-config -c /etc/codis/config_10.ini server add 1 10.10.32.42:6379 master
 ./bin/codis-config -c /etc/codis/config_10.ini server add 1 10.10.32.43:6380 slave
 ./bin/codis-config -c /etc/codis/config_10.ini server add 2 10.10.32.43:6379 master
 ./bin/codis-config -c /etc/codis/config_10.ini server add 2 10.10.32.44:6380 slave
 ./bin/codis-config -c /etc/codis/config_10.ini server add 3 10.10.32.44:6379 master
 ./bin/codis-config -c /etc/codis/config_10.ini server add 3 10.10.32.42:6380 slave

5、设置 server group 服务的 slot 范围 Codis 采用 Pre-sharding 的技术来实现数据的分片, 默认分成 1024 个 slots (0-1023), 对于每个key来说, 通过以下公式确定所属的 Slot Id : SlotId = crc32(key) % 1024 每一个 slot 都会有一个特定的 server group id 来表示这个 slot 的数据由哪个 server group 来提供.(codis-config上操作)

cd /data/go/src/github.com/wandoulabs/codis/
 ./bin/codis-config -c /etc/codis/config_10.ini slot range-set 0 300 1 online
 ./bin/codis-config -c /etc/codis/config_10.ini slot range-set 301 700 2 online
 ./bin/codis-config -c /etc/codis/config_10.ini slot range-set 701 1023 3 online

6、启动 codis-proxy (codis-proxy上操作)

cat /etc/codis/config_10.ini ##撰写配置文件
 zk=10.10.0.47:2181,10.10.0.48:2181,10.10.1.76:2181
 product=zh_news
 proxy_id=codis-proxy_10 ##10.10.32.49上改成codis-proxy_49,多个proxy,proxy_id 需要唯一
 net_timeout=5000
 proto=tcp4
 dashboard_addr=10.10.32.10:18087
cd /data/go/src/github.com/wandoulabs/codis/ && ./bin/codis-proxy -c /etc/codis/config_10.ini -L /data/log/codis-proxy_10.log --cpu=4 --addr=0.0.0.0:19000 --http-addr=0.0.0.0:11000 &
 cd /data/go/src/github.com/wandoulabs/codis/ && ./bin/codis-proxy -c /etc/codis/config_49.ini -L /data/log/codis-proxy_49.log --cpu=4 --addr=0.0.0.0:19000 --http-addr=0.0.0.0:11000 &

OK,整个集群已经搭建成功了,截图给你们show show

11

六、codis-server的HA

codis-ha实现codis-server的主从切换,codis-server主库挂了会提升一个从库为主库,从库挂了会设置这个从库从集群下线
1、安装

export GOPATH=/data/go
/usr/local/go/bin/go get github.com/ngaut/codis-ha
cd /data/go/src/github.com/ngaut/codis-ha
go build
cp codis-ha /data/go/src/github.com/wandoulabs/codis/bin/
使用方法:
codis-ha --codis-config=dashboard地址:18087 --productName=集群项目名称

2、使用supervisord管理codis-ha进程

yum -y install supervisord

/etc/supervisord.conf中添加如下内容:

 [program:codis-ha]
 autorestart = True
 stopwaitsecs = 10
 startsecs = 1
 stopsignal = QUIT
 command = /data/go/src/github.com/wandoulabs/codis/bin/codis-ha --codis-config=10.10.32.17:18087 --productName=dh_tianqi
 user = root
 startretries = 3
 autostart = True
 exitcodes = 0,2

3、启动supervisord服务

/etc/init.d/supervisord start
 chkconfig supervisord on

此时,ps -ef |grep codis-ha 你回发现codis-ha进程已经启动,这个时候你去停掉一个codis-server的master,看看slave会不会提升为master呢

七、关于监控

关于整个codis集群的监控,我们这边用的是zabbix,监控的指标比较简单,所以这块大家有什么好的建议多给我提提哈
zookeeper:监控各个节点的端口联通性(以后想着把进程也监控上)
codis-proxy:监控了端口的联通性,这个监控远远不够呀
codis-server:监控了内存使用率、连接数、联通性
codis-ha:监控进程
dashboard:监控端口联通性

八、使用过程中遇到的问题

  • codis-proxy的日志切割,codis-proxy的默认日志级别是info,日志量很大,我们这边每天产生50多G日志,目前codis-proxy还不支持热重启,想修改启动参数还是比较麻烦的,日志切割推荐用logrotate
  • codis-proxy的监听地址默认没有具体ipv4,也就是codis-proxy启动之后没有0.0.0.0:19000这样的监听,这样会导致的问题就是前端lvs没有办法负载均衡codis-proxy,不能转发请求过,这个问题已联系作者处理了,在codis-proxy启动的配置文件中加上proto=tcp4这个参数就支持监听ipv4了
  • 添加 Redis Server Group的时候,非codis-server(原生的redis)竟然也能加入到codis集群里面,在redis和codis-server共存在一个物理机上的清楚,很容易加错,希望能有个验证,非codis-server不能加入到codis集群
  • codis集群内部通讯是通过主机名的,如果主机名没有做域名解析那dashboard是通过主机名访问不到proxy的http-addr地址的,这会导致从web界面上看不到 OP/s的数据,至于还有没有其他问题,目前我这边还没有发现,建议内部通讯直接用内网IP

原创作品地址:http://navyaijm.blog.51cto.com/4647068/1637688

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>