因公司数据安全和分析的需要,故调研了一下

GlusterFS +  lagstash + elasticsearch + kibana 3  + redis 整合在一起的日志管理应用:

安装,配置过程,使用情况等续


一,glusterfs分布式文件系统部署:

说明:

公司想做网站业务日志及系统日志统一收集和管理,经过对mfs, fastdfs 等分布式文件系统的调研,最后选择了 glusterfs,因为Gluster具有高扩展性、高性能、高可用性、可横向扩展的弹性特点,无元数据服务器设计使glusterfs没有单点故障隐患,官网:www.gluster.org

1.      系统环境准备:

Centos 6.4

服务端:

192.168.10.101

192.168.10.102

192.168.10.188

192.168.10.189

客户端:

192.168.10.103

EPEL源和GlusterFS

增加EPEL源和GLusterFS源,EPEL源中包含GLusterFS,版本比较旧,相对稳定,本次测试采用最新的3.5.0版本。

rpm -Uvh http://dl.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-8.noarch.rpm

wget -P /etc/yum.repos.dhttp://download.gluster.org/pub/gluster/glusterfs/LATEST/CentOS/glusterfs-epel.repo

2.      部署过程

服务端安装:

yum -y install glusterfs glusterfs-fuseglusterfs-server

chkconfig glusterd on

service glusterd start

服务端配置:

4个存储节点组成一集群,本文在第一个节点执行,只需要在任意节点执行就ok

[root@db1 ~]# gluster peer probe192.168.10.102

probe successful

[root@db1 ~]# gluster peer probe192.168.10.188

probe successful

[root@db1 ~]# gluster peer probe 192.168.10.189

probe successful

查看集群的节点信息:

[root@db1 ~]# gluster peer status

number of peers: 3

hostname: 192.168.10.102

uuid:b9437089-b2a1-4848-af2a-395f702adce8

state: peer in cluster (connected)

hostname: 192.168.10.188

uuid: ce51e66f-7509-4995-9531-4c1a7dbc2893

state: peer in cluster (connected)

hostname: 192.168.10.189

uuid:66d7fd67-e667-4f9b-a456-4f37bcecab29

state: peer in cluster (connected)

/data/gluster为共享目录,创建名为test-volume的卷,副本数为2

sh cmd.sh "mkdir /data/gluster"

[root@db1 ~]#  gluster volume create test-volume replica 2192.168.10.101:/data/gluster 192.168.10.102:/data/gluster192.168.10.188:/data/gluster 192.168.10.189:/data/gluster

creation of volume test-volume has beensuccessful. please start the volume to access data.

启动卷:

[root@db1 ~]# gluster volume starttest-volume

starting volume test-volume has beensuccessful

查看卷状态:

[root@db1 ~]# gluster volume info

volume name: test-volume

type: distributed-replicate

status: started

number of bricks: 2 x 2 = 4

transport-type: tcp

bricks:

brick1: 192.168.10.101:/data/gluster

brick2: 192.168.10.102:/data/gluster

brick3: 192.168.10.188:/data/gluster

brick4: 192.168.10.189:/data/gluster

3.      客户端安装配置:

安装:

yum -y installglusterfs glusterfs-fuse

挂载:

mount -t glusterfs 192.168.10.102:/test-volume/mnt/ (挂载任意一个节点即可)推荐用这种方式。

mount -t nfs -o mountproto=tcp,vers=3192.168.10.102:/test-volume /log/mnt/ (使用nfs挂载,注意远端的rpcbind服务必须开启)

echo "192.168.10.102:/test-volume/mnt/ glusterfs defaults,_netdev 0 0" >> /etc/fstab (开机自动挂载)

4.      测试

检查文件正确性

dd if=/dev/zero of=/mnt/1.img bs=1Mcount=1000 # 在挂载客户端生成测试文件

cp /data/navy /mnt/  # 文件拷贝到存储上

宕机测试。

使用glusterfs-fuse挂载,即使目标服务器故障,也完全不影响使用。用NFS则要注意挂载选项,否则服务端故障容易导致文件系统halt住而影响服务!

# 将其中一个节点停止存储服务service glusterd stop

service glusterfsd stop# 在挂载客户端删除测试文件

rm -fv /mnt/navy# 此时在服务端查看,服务被停止的节点上navy并未被删除。此时启动服务:serviceglusterd start# 数秒后,navy就被自动删除了。新增文件效果相同!

5.      运维常用命令:

删除卷

gluster volume stop test-volume

gluster volume delete test-volume

将机器移出集群

gluster peer detach 192.168.10.102

只允许172.28.0.0的网络访问glusterfs

gluster volume set test-volumeauth.allow 192.168.10.*

加入新的机器并添加到卷里(由于副本数设置为2,至少要添加2468..)台机器)

gluster peer probe 192.168.10.105

gluster peer probe 192.168.10.106

gluster volume add-brick test-volume192.168.10.105:/data/gluster 192.168.10.106:/data/gluster

收缩卷

# 收缩卷前gluster需要先移动数据到其他位置

gluster volume remove-brick test-volume192.168.10.101:/data/gluster/test-volume192.168.10.102:/data/gluster/test-volume start

# 查看迁移状态

gluster volume remove-brick test-volume192.168.10.101:/data/gluster/test-volume192.168.10.102:/data/gluster/test-volume status

# 迁移完成后提交

gluster volume remove-brick test-volume192.168.10.101:/data/gluster/test-volume192.168.10.102:/data/gluster/test-volume commit

迁移卷

# 192.168.10.101的数据迁移到,先将192.168.10.107加入集群

gluster peer probe 192.168.10.107

gluster volume replace-bricktest-volume 192.168.10.101:/data/gluster/test-volume192.168.10.107:/data/gluster/test-volume start

# 查看迁移状态gluster volume replace-brick test-volume192.168.10.101:/data/gluster/test-volume192.168.10.107:/data/gluster/test-volume status

# 数据迁移完毕后提交gluster volume replace-brick test-volume192.168.10.101:/data/gluster/test-volume192.168.10.107:/data/gluster/test-volume commit

# 如果机器192.168.10.101出现故障已经不能运行,执行强制提交然后要求gluster马上执行一次同步

gluster volume replace-bricktest-volume 192.168.10.101:/data/gluster/test-volume192.168.10.102:/data/gluster/test-volume commit -force

gluster volume heal test-volumes full

24007

二.日志收集系统部署

说明简解:

系统各部分应用介绍

Logstash:做系统log收集,转载的工具。同时集成各类日志插件,对日志查询和分析的效率有很大的帮助.一般使用shipper作为log收集、indexer作为log转载.

Logstash shipper收集log 并将log转发给redis 存储

Logstash indexerredis中读取数据并转发给elasticsearch

redis:是一个dblogstash shipperlog转发到redis数据库中存储。Logstash indexerredis中读取数据并转发给elasticsearch

Elasticsearch:开源的搜索引擎框架,前期部署简单,使用也简单,但后期需要做必要的优化具体请参照博客http://chenlinux.com/categories.html#logstash-ref  logstash部分.可进行多数据集群,提高效率。从redis中读取数据,并转发到kibana

Kibana 开源web展现。

虚拟服务器准备:

192.168.10.143    logstash shipper

192.168.10.144       logstash  indexer redis

192.168.10.145    elasticsearch  kibana3

1.三台主机都要安装jdk 1.7

推荐oracle jdk 1.7+版本

java -version

设置java的环境变量,比如

vim~/.bashrc

>>

JAVA_HOME=/usr/java/jdk1.7.0_55

PATH=$PATH:/$JAVA_HOME/bin

CLASSPATH=.:$JAVA_HOME/lib

JRE_HOME=$JAVA_HOME/jre

export JAVA_HOME PATH CLASSPATH JRE_HOME

>>

source ~/.bashrc

2.安装redis192.168.10.144

wgethttp://download.redis.io/releases/redis-2.6.16.tar.gz

tar -zxf redis-2.6.16.tar.gz

cd redis-2.6.16

make &&  make install

./src/redis-server ../redis.conf

启动redis客户端来验证安装

./src/redis-cli

> keys *    #列出所有的key

3.安装Elasticsearch192.168.10.145

wgethttp://download.elasticsearch.org/elasticsearch/elasticsearch/elasticsearch-0.90.13.zip

unzipelasticsearch-0.90.13.zip

elasticsearch解压即可使用非常方便,接下来我们看一下效果,首先启动ES服务,切换到elasticsearch目录,运行bin下的elasticsearch

cd  elasticsearch-0.90.13

bin/elasticsearch -f

访问默认的9200端口

curl -X GET http://localhost:9200

4.安装logstash 192.168.10.143 192.168.10.144

wgethttp://download.elasticsearch.org/logstash/logstash/logstash-1.2.1-flatjar.jar

logstash下载即可使用,命令行参数可以参考logstash flags,主要有

agent  #运行Agent模式

-f CONFIGFILE #指定配置文件

web    #自动Web服务

-p PORT #指定端口,默认9292

5. 安装kibana192.168.10.145

logstash的最新版已经内置kibana,你也可以单独部署kibanakibana3是纯粹JavaScript+html的客户端,所以可以部署到任意http服务器上。

wgethttp://download.elasticsearch.org/kibana/kibana/kibana-latest.zip

unzip kibana-latest.zip

cp-r  kibana-latest /var/www/html

可以修改config.js来配置elasticsearch的地址和索引。

修改以下行。

 elasticsearch:"http://192.168.10.145:9200",

 

 

 

 

 

 

 

6.      整合配置:

192.168.10.143 logstash shipper  配置收集日志

Vim /etc/logstash_shipper.conf

input{

file  {

type => "linux-syslog"

path => [ "/var/log/lastlog", "/var/log/syslog","/var/log/lastlog" ]

}

}

output {

redis {

host => "192.168.10.144"

port => “6379”

data_type =>"list"

key => "syslog"

}

}

启动logstash shipper

Nohup java –jar logstash-1.2.1-flatjar.jar agent –f /etc/ logstash_shipper.conf &

过十秒后,输出如下信息:

Using milestone 2input plugin 'file'. This plugin should be stable, but if you see strangebehavior, please let us know! For more information on plugin milestones, seehttp://logstash.net/docs/1.2.2/plugin-milestones {:level=>:warn}

Using milestone 2 output plugin 'redis'.This plugin should be stable, but if you see strange behavior, please let usknow! For more information on plugin milestones, see http://logstash.net/docs/1.2.2/plugin-milestones{:level=>:warn}

192.168.10.144  logstash indexer 配置如下:

Vim /etc/logstash_indexer.conf

input{

redis

{

host => "192.168.10.144"

data_type =>"list"

port => "6379"

key => "syslog"

type => "redis-input"

}

}

output

{

elasticsearch {

host => "192.168.10.145"

port => "9300"

}

}

启动logstash  indexer

Nohup java –jar logstash-1.2.1-flatjar.jar agent –f /etc/ logstash_indexer.conf &

输出同上。

7.      登录 http://192.168.10.145/kibana  访问如下

wKiom1Ph7HmiripNAAMEXMUr9gQ661.jpg

三,整合分布式文件存储和日志收集系统

逻辑图如下:

wKioL1Ph7UfScu8OAAST_tSjG_4895.jpg

glusterfs 挂载到web服务器端,具体需要编写日志结构化程序配合日志写到glusterfs存储上。