ELK+Filebeat+Kafka+ZooKeeper 构建海量日志分析平台-白红宇

ELK+Filebeat+Kafka+ZooKeeper 构建海量日志分析平台

阅读量：6367 次

发布时间：2019-06-23

本文共 25936 字，大约阅读时间需要 86 分钟。

日志分析平台，架构图如下:

架构解读 : （整个架构从左到右，总共分为5层）

第一层、数据采集层

最左边的是业务服务器集群，上面安装了filebeat做日志采集，同时把采集的日志分别发送给两个logstash服务。

第二层、

logstash服务把接受到的日志经过格式处理，转存到本地的kafka broker+zookeeper集群中。

第三层、数据转发层

这个单独的Logstash节点会实时去kafka broker集群拉数据，转发至ES DataNode。

第四层、数据持久化存储

ES DataNode 会把收到的数据，写磁盘，建索引库。

第五层、数据检索，数据展示

ES Master + Kibana 主要协调ES集群，处理数据检索请求，数据展示。

一、服务规划：

主机名	IP地址	服务	服务作用
ZooKeeper-Kafka-01	10.200.3.85	logstash+Kafka+ZooKeeper	数据处理层，数据缓存层
ZooKeeper-Kafka-02	10.200.3.86	logstash+Kafka+ZooKeeper	数据处理层，数据缓存层
ZooKeeper-Kafka-03	10.200.3.87	Kafka+ZooKeeper	数据缓存层
logstash-to-es-01	10.200.3.88	logstash	转发层logstash转发到es
logstash-to-es-02	10.200.3.89	logstash	转发层logstash转发到es
Esaster-Kibana	10.200.3.90	ES Master+Kibana	数据持久化存储和数据展示
ES-DataNode01	10.200.3.91	ES DataNode	数据持久化存储
ES-DataNode02	10.200.3.92	ES DataNode	数据持久化存储
nginx-filebeat	10.20.9.31	nginx-filebeat	filebeat收集nginx日志
java-filebeat	10.20.9.52	java-filebeat	filebeat收集tomcat日志

2、软件下载和安装：

所有服务器Java jdk版本必须在1.8以上.

Elasticsearch下载地址：wget -P /usr/local/src/ https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.6.2.tar.gzlogstash下载地址：wget -P /usr/local/src/ https://artifacts.elastic.co/downloads/logstash/logstash-5.6.2.tar.gzkibana下载地址：wget -P /usr/local/src/ https://artifacts.elastic.co/downloads/kibana/kibana-5.6.2-linux-x86_64.tar.gzZookeeper+Kafka下载地址：#wget http://mirrors.hust.edu.cn/apache/zookeeper/zookeeper-3.4.10/zookeeper-3.4.10.tar.gz#wget http://mirror.bit.edu.cn/apache/kafka/1.1.0/kafka_2.12-1.1.0.tgzfilebeat下载：#curl -L -O https://artifacts.elastic.co/downloads/beats/filebeat/filebeat-5.6.8-x86_64.rpm#rpm -vi filebeat-5.6.8-x86_64.rpm

3、配置安装服务：

一、Elasticsearch集群服务安装：

[root@Esaster-Kibana src]# tar -zxvf elasticsearch-5.6.2.tar.gz -C /usr/local/[root@Esaster-Kibana src]# cd ..[root@Esaster-Kibana local]# ln -s elasticsearch-5.6.2 elasticsearch

创建用户组

[root@Esaster-Kibana local]# groupadd elsearch[root@Esaster-Kibana local]# useradd -g elsearch elsearch[root@Esaster-Kibana local]# chown -R elsearch:elsearch  elasticsearch*

设置系统的相关参数,如果不设置参数将会存在相关的问题导致不能启动

[root@Esaster-Kibana local]# vim /etc/security/limits.conf# End of file* soft nproc 65535* hard nproc 65535* soft nofile 65536* hard nofile 65536elsearch soft memlock unlimitedelsearch hard memlock unlimited

修改最大线程数的配置

[root@Esaster-Kibana ~]# vim /etc/security/limits.d/20-nproc.conf*          soft    nproc     65536root       soft    nproc     unlimited[root@Esaster-Kibana ~]# vim /etc/sysctl.confvm.max_map_count=262144fs.file-max=65536[root@Esaster-Kibana ~]# sysctl -p

配置文件

[root@Esaster-Kibana ~]# vim /usr/local/elasticsearch/config/elasticsearch.yml network.host: 10.200.3.90http.port: 9200

启动程序

[root@Esaster-Kibana ~]# su - elsearch[elsearch@Esaster-Kibana ~]$ /usr/local/elasticsearch/bin/elasticsearch -d

验证有没有启动成功.

[elsearch@Esaster-Kibana ~]$ curl http://10.200.3.90:9200{  "name" : "AUtPyaG",  "cluster_name" : "elasticsearch",  "cluster_uuid" : "5hFyJ-4TShaaevOp4q-TUg",  "version" : {    "number" : "5.6.2",    "build_hash" : "57e20f3",    "build_date" : "2017-09-23T13:16:45.703Z",    "build_snapshot" : false,    "lucene_version" : "6.6.1"  },  "tagline" : "You Know, for Search"}

至此单台的Elasticsearch部署完成，如果是集群的话只需要改elasticsearch.yml文件,添加选项即可!!

Elasticsearch集群部署

10.200.3.90 ES Master+Kibana

10.200.3.91 ES DataNode

10.200.3.92 ES DataNode

1.将3.90上面的 Elasticsearch复制到另外两台节点服务器中，只需要更改配置文件即可.

2.Elasticsearch集群Master配置文件如下(10.200.3.90:9200)：

[elsearch@Esaster-Kibana config]$ cat elasticsearch.yml# ======================== Elasticsearch Configuration =========================#集群的名称，同一个集群该值必须设置成相同的cluster.name: my-cluster#该节点的名字node.name: node-1#该节点有机会成为master节点node.master: true#该节点可以存储数据node.data: truepath.data: /usr/local/elasticsearch/datapath.logs: /usr/local/elasticsearch/logsbootstrap.memory_lock: true#设置绑定的IP地址,可以是IPV4或者IPV6network.bind_host: 0.0.0.0#设置其他节点与该节点交互的IP地址network.publish_host: 10.200.3.90#该参数用于同时设置bind_host和publish_hostnetwork.host: 10.200.3.90#设置节点之间交互的端口号transport.tcp.port: 9300#设置是否压缩tcp上交互传输的数据transport.tcp.compress: true#设置http内容的最大大小]http.max_content_length: 100mb#是否开启http服务对外提供服务http.enabled: truehttp.port: 9200discovery.zen.ping.unicast.hosts: ["10.200.3.90:9300","10.200.3.91:9300", "10.200.3.92:9300"]discovery.zen.minimum_master_nodes: 2http.cors.enabled: truehttp.cors.allow-origin: "*"

3.Elasticsearch DataNode01节点(10.200.3.91)

[root@ES-DataNode01 config]# vim elasticsearch.yml |grep -v ^$# ======================== Elasticsearch Configuration =========================#集群的名称，同一个集群该值必须设置成相同的cluster.name: my-cluster#该节点的名字node.name: node-2#该节点有机会成为master节点node.master: true#该节点可以存储数据node.data: truepath.data: /usr/local/elasticsearch/datapath.logs: /usr/local/elasticsearch/logsbootstrap.memory_lock: true#设置绑定的IP地址,可以是IPV4或者IPV6network.bind_host: 0.0.0.0#设置其他节点与该节点交互的IP地址network.publish_host: 10.200.3.91#该参数用于同时设置bind_host和publish_hostnetwork.host: 10.200.3.91#设置节点之间交互的端口号transport.tcp.port: 9300#设置是否压缩tcp上交互传输的数据transport.tcp.compress: true#设置http内容的最大大小]http.max_content_length: 100mb#是否开启http服务对外提供服务http.enabled: truehttp.port: 9200discovery.zen.ping.unicast.hosts: ["10.200.3.90:9300","10.200.3.91:9300", "10.200.3.92:9300"]discovery.zen.minimum_master_nodes: 2http.cors.enabled: truehttp.cors.allow-origin: "*"

4.Elasticsearch DataNode02节点(10.200.3.92)

[root@ES-DataNode02 config]# vim elasticsearch.yml |grep -v ^$# ======================== Elasticsearch Configuration =========================#集群的名称，同一个集群该值必须设置成相同的cluster.name: my-cluster#该节点的名字node.name: node-3#该节点有机会成为master节点node.master: true#该节点可以存储数据node.data: truepath.data: /usr/local/elasticsearch/datapath.logs: /usr/local/elasticsearch/logsbootstrap.memory_lock: true#设置绑定的IP地址,可以是IPV4或者IPV6network.bind_host: 0.0.0.0#设置其他节点与该节点交互的IP地址network.publish_host: 10.200.3.92#该参数用于同时设置bind_host和publish_hostnetwork.host: 10.200.3.92#设置节点之间交互的端口号transport.tcp.port: 9300#设置是否压缩tcp上交互传输的数据transport.tcp.compress: true#设置http内容的最大大小]http.max_content_length: 100mb#是否开启http服务对外提供服务http.enabled: truehttp.port: 9200discovery.zen.ping.unicast.hosts: ["10.200.3.90:9300","10.200.3.91:9300", "10.200.3.92:9300"]discovery.zen.minimum_master_nodes: 2http.cors.enabled: truehttp.cors.allow-origin: "*"

5.启动每个服务

# /usr/local/elasticsearch/bin/elasticsearch -d

使用curl 查看输入和查看日志信息.如果没有错误则部署成功.

至此Elasticsearch集群部署完成.

6.通过cluster API查看集群状态：

[root@ES-DataNode02 config]# curl -XGET 'http://10.200.3.90:9200/_cluster/health?pretty=true'{  "cluster_name" : "my-cluster",  "status" : "green",  "timed_out" : false,  "number_of_nodes" : 3,  "number_of_data_nodes" : 3,  "active_primary_shards" : 0,  "active_shards" : 0,  "relocating_shards" : 0,  "initializing_shards" : 0,  "unassigned_shards" : 0,  "delayed_unassigned_shards" : 0,  "number_of_pending_tasks" : 0,  "number_of_in_flight_fetch" : 0,  "task_max_waiting_in_queue_millis" : 0,  "active_shards_percent_as_number" : 100.0}

配置head插件:

首先安装npm软件包

参考文档：

Head插件安装：

参考文档：

Elasticsearch 5.2.x 使用 Head 插件连接不上集群

参考文档：

访问地址：http://10.200.3.90:9100/

二、安装kibana5.6(10.200.3.90):

#tar -zxvf kibana-5.6.2-linux-x86_64.tar.gz -C /usr/local/[root@Esaster-Kibana local]# ln -s kibana-5.6.2-linux-x86_64 kibana[root@Esaster-Kibana local]# cd kibana/config/[root@Esaster-Kibana config]# vim kibana.ymlserver.port: 5601server.host: "10.200.3.90"server.name: "Esaster-Kibana"elasticsearch.url: http://10.200.3.90:9200启动kibana服务[root@Esaster-Kibana config]#/usr/local/kibana/bin/kibana &访问地址：http://10.200.3.90:5601/app/kibana

三、Zookeeper+Kafka集群部署:

10.200.3.85 Kafka+ZooKeeper

10.200.3.86 Kafka+ZooKeeper

10.200.3.87 Kafka+ZooKeeper

Zookeeper+Kafka下载地址：

#wget http://mirrors.hust.edu.cn/apache/zookeeper/zookeeper-3.4.10/zookeeper-3.4.10.tar.gz#wget http://mirror.bit.edu.cn/apache/kafka/1.1.0/kafka_2.12-1.1.0.tgz

1.三台主机hosts如下，必须保持一致.

# cat /etc/hosts10.200.3.85 ZooKeeper-Kafka-01 10.200.3.86 ZooKeeper-Kafka-0210.200.3.87 ZooKeeper-Kafka-03

2.安装zookeeper

# 在master节点上操作

[root@ZooKeeper-Kafka-01 src]# tar -zxvf zookeeper-3.4.10.tar.gz -C /usr/local/[root@ZooKeeper-Kafka-01 src]# cd ..[root@ZooKeeper-Kafka-01 local]# ln -s zookeeper-3.4.10 zookeeper[root@ZooKeeper-Kafka-01 local]# cd zookeeper/conf/[root@ZooKeeper-Kafka-01 conf]# cp zoo_sample.cfg zoo.cfgtickTime=2000initLimit=10syncLimit=5dataDir=/tmp/zookeeperclientPort=2181server.1=ZooKeeper-Kafka-01:2888:3888server.2=ZooKeeper-Kafka-02:2888:3888server.3=ZooKeeper-Kafka-03:2888:3888

3.创建dataDir目录创建/tmp/zookeeper

# 在master节点上[root@ZooKeeper-Kafka-01 conf]# mkdir /tmp/zookeeper[root@ZooKeeper-Kafka-01 conf]# touch /tmp/zookeeper/myid[root@ZooKeeper-Kafka-01 conf]# echo 1 > /tmp/zookeeper/myid3.将zookeeper文件复制到另外两个节点：[root@ZooKeeper-Kafka-01 local]# scp -r zookeeper-3.4.10/ 10.200.3.86:/usr/local/[root@ZooKeeper-Kafka-01 local]# scp -r zookeeper-3.4.10/ 10.200.3.87:/usr/local/

4.在两个slave节点创建目录和文件

#ZooKeeper-Kafka-02节点:[root@ZooKeeper-Kafka-02 local]# ln -s zookeeper-3.4.10 zookeeper[root@ZooKeeper-Kafka-02 local]# mkdir /tmp/zookeeper[root@ZooKeeper-Kafka-02 local]# touch /tmp/zookeeper/myid[root@ZooKeeper-Kafka-02 local]# echo 2 > /tmp/zookeeper/myid#ZooKeeper-Kafka-03节点[root@ZooKeeper-Kafka-03 local]# ln -s zookeeper-3.4.10 zookeeper[root@ZooKeeper-Kafka-03 local]# mkdir /tmp/zookeeper[root@ZooKeeper-Kafka-03 local]# touch /tmp/zookeeper/myid[root@ZooKeeper-Kafka-03 local]# echo 3 > /tmp/zookeeper/myid

5.分别在每个节点上启动 zookeeper测试：

[root@ZooKeeper-Kafka-01 zookeeper]# ./bin/zkServer.sh start[root@ZooKeeper-Kafka-02 zookeeper]# ./bin/zkServer.sh start[root@ZooKeeper-Kafka-03 zookeeper]# ./bin/zkServer.sh start

6.查看状态：

[root@ZooKeeper-Kafka-01 zookeeper]# ./bin/zkServer.sh statusZooKeeper JMX enabled by defaultUsing config: /usr/local/zookeeper/bin/../conf/zoo.cfgMode: follower[root@ZooKeeper-Kafka-02 zookeeper]# ./bin/zkServer.sh statusZooKeeper JMX enabled by defaultUsing config: /usr/local/zookeeper/bin/../conf/zoo.cfgMode: leader[root@ZooKeeper-Kafka-03 zookeeper]# ./bin/zkServer.sh statusZooKeeper JMX enabled by defaultUsing config: /usr/local/zookeeper/bin/../conf/zoo.cfgMode: follower

至此zookeeper集群安装成功！！！

Kafka集群安装配置

[root@ZooKeeper-Kafka-01 src]# tar -zxvf kafka_2.12-1.1.0.tgz -C /usr/local/[root@ZooKeeper-Kafka-01 src]# cd ..[root@ZooKeeper-Kafka-01 local]# ln -s kafka_2.12-1.1.0 kafka

修改server.properties文件

[root@ZooKeeper-Kafka-01 local]# cd kafka/config/[root@ZooKeeper-Kafka-01 config]# vim server.propertiesbroker.id=0listeners=PLAINTEXT://ZooKeeper-Kafka-01:9092advertised.listeners=PLAINTEXT://ZooKeeper-Kafka-01:9092num.network.threads=3num.io.threads=8socket.send.buffer.bytes=102400socket.receive.buffer.bytes=102400socket.request.max.bytes=104857600log.dirs=/tmp/kafka-logsnum.partitions=5num.recovery.threads.per.data.dir=1offsets.topic.replication.factor=1transaction.state.log.replication.factor=1transaction.state.log.min.isr=1log.retention.hours=24log.segment.bytes=1073741824log.retention.check.interval.ms=300000zookeeper.connect=ZooKeeper-Kafka-01:2181,ZooKeeper-Kafka-02:2181,ZooKeeper-Kafka-03:2181zookeeper.connection.timeout.ms=6000group.initial.rebalance.delay.ms=0delete.topic.enable=true[root@ZooKeeper-Kafka-01 config]#

将 kafka_2.12-1.1.0 文件夹复制到另外两个节点下

[root@ZooKeeper-Kafka-01 local]# scp -r kafka_2.12-1.1.0/ 10.200.3.86:/usr/local/[root@ZooKeeper-Kafka-01 local]# scp -r kafka_2.12-1.1.0/ 10.200.3.87:/usr/local/

并修改每个节点对应的 server.properties 文件的 broker.id和listeners、advertised.listeners的名称.

ZooKeeper-Kafka-02主机配置文件如下：

[root@ZooKeeper-Kafka-02 config]# cat server.propertiesbroker.id=1listeners=PLAINTEXT://ZooKeeper-Kafka-02:9092advertised.listeners=PLAINTEXT://ZooKeeper-Kafka-02:9092num.network.threads=3num.io.threads=8socket.send.buffer.bytes=102400socket.receive.buffer.bytes=102400socket.request.max.bytes=104857600log.dirs=/tmp/kafka-logsnum.partitions=5num.recovery.threads.per.data.dir=1offsets.topic.replication.factor=1transaction.state.log.replication.factor=1transaction.state.log.min.isr=1log.retention.hours=24log.segment.bytes=1073741824log.retention.check.interval.ms=300000zookeeper.connect=ZooKeeper-Kafka-01:2181,ZooKeeper-Kafka-02:2181,ZooKeeper-Kafka-03:2181zookeeper.connection.timeout.ms=6000group.initial.rebalance.delay.ms=0delete.topic.enable=true

ZooKeeper-Kafka-03主机配置文件如下：

[root@ZooKeeper-Kafka-03 config]# cat server.propertiesbroker.id=2listeners=PLAINTEXT://ZooKeeper-Kafka-03:9092advertised.listeners=PLAINTEXT://ZooKeeper-Kafka-03:9092num.network.threads=3num.io.threads=8socket.send.buffer.bytes=102400socket.receive.buffer.bytes=102400socket.request.max.bytes=104857600log.dirs=/tmp/kafka-logsnum.partitions=5num.recovery.threads.per.data.dir=1offsets.topic.replication.factor=1transaction.state.log.replication.factor=1transaction.state.log.min.isr=1log.retention.hours=24log.segment.bytes=1073741824log.retention.check.interval.ms=300000zookeeper.connect=ZooKeeper-Kafka-01:2181,ZooKeeper-Kafka-02:2181,ZooKeeper-Kafka-03:2181zookeeper.connection.timeout.ms=6000group.initial.rebalance.delay.ms=0delete.topic.enable=true

启动服务:

#bin/kafka-server-start.sh config/server.properties &

Zookeeper+Kafka集群测试

创建topic：

[root@ZooKeeper-Kafka-01 kafka]# bin/kafka-topics.sh --create --zookeeper ZooKeeper-Kafka-01:2181, ZooKeeper-Kafka-02:2181, ZooKeeper-Kafka-03:2181 --replication-factor 3 --partitions 3 --topic test

显示topic：

[root@ZooKeeper-Kafka-01 kafka]# bin/kafka-topics.sh --describe --zookeeper ZooKeeper-Kafka-01:2181, ZooKeeper-Kafka-02:2181, ZooKeeper-Kafka-03:2181 --topic test

列出topic：

[root@ZooKeeper-Kafka-01 kafka]# bin/kafka-topics.sh --list --zookeeper ZooKeeper-Kafka-01:2181, ZooKeeper-Kafka-02:2181, ZooKeeper-Kafka-03:2181test[root@ZooKeeper-Kafka-01 kafka]#

创建 producer(生产者);

# 在master节点上测试生产消息

[root@ZooKeeper-Kafka-01 kafka]# bin/kafka-console-producer.sh --broker-list ZooKeeper-Kafka-01:9092 -topic test>hello world>[2018-04-03 12:18:25,545] INFO Updated PartitionLeaderEpoch. New: {epoch:0, offset:0}, Current: {epoch:-1, offset:-1} for Partition: test-0. Cache now contains 0 entries. (kafka.server.epoch.LeaderEpochFileCache)this is example ...>[2018-04-03 12:19:16,342] INFO Updated PartitionLeaderEpoch. New: {epoch:0, offset:0}, Current: {epoch:-1, offset:-1} for Partition: test-2. Cache now contains 0 entries. (kafka.server.epoch.LeaderEpochFileCache)welcome to china>[2018-04-03 12:20:53,141] INFO Updated PartitionLeaderEpoch. New: {epoch:0, offset:0}, Current: {epoch:-1, offset:-1} for Partition: test-1. Cache now contains 0 entries. (kafka.server.epoch.LeaderEpochFileCache)

创建 consumer(消费者):

# 在ZooKeeper-Kafka-02节点上测试消费

[root@ZooKeeper-Kafka-02 kafka]# bin/kafka-console-consumer.sh --zookeeper ZooKeeper-Kafka-01:2181, ZooKeeper-Kafka-02:2181, ZooKeeper-Kafka-03:2181 -topic test --from-beginningUsing the ConsoleConsumer with old consumer is deprecated and will be removed in a future major release. Consider using the new consumer by passing [bootstrap-server] instead of [zookeeper].this is example ...hello world[2018-04-03 12:20:53,145] INFO Updated PartitionLeaderEpoch. New: {epoch:0, offset:0}, Current: {epoch:-1, offset:-1} for Partition: test-1. Cache now contains 0 entries. (kafka.server.epoch.LeaderEpochFileCache)welcome to china

#在ZooKeeper-Kafka-03节点上测试消费

[root@ZooKeeper-Kafka-03 kafka]# bin/kafka-console-consumer.sh --zookeeper ZooKeeper-Kafka-01:2181, ZooKeeper-Kafka-02:2181, ZooKeeper-Kafka-03:2181 -topic test --from-beginningUsing the ConsoleConsumer with old consumer is deprecated and will be removed in a future major release. Consider using the new consumer by passing [bootstrap-server] instead of [zookeeper].welcome to chinahello worldthis is example ...

然后在 producer 里输入消息，consumer 中就会显示出同样的内容，表示消费成功!

删除 topic

[root@ZooKeeper-Kafka-01 kafka]# bin/kafka-topics.sh --delete --zookeeper ZooKeeper-Kafka-01:2181, ZooKeeper-Kafka-02:2181, ZooKeeper-Kafka-03:2181 --topic test

启动和关闭服务:

#启动服务:bin/kafka-server-start.sh config/server.properties &#停止服务：bin/kafka-server-stop.sh

至此Zookeeper+Kafka集群配置成功.

四、logstash安装和配置

hlogstash-to-kafka端logstash安装配置(logstash从filebeat读取日志后写入到kafka中)：

主机(10.200.3.85 10.200.3.86)

[root@ZooKeeper-Kafka-01 src]#  tar -zxvf logstash-5.6.2.tar.gz -C [root@ZooKeeper-Kafka-01 src]#  cd /usr/local/[root@ZooKeeper-Kafka local]# ln -s logstash-5.6.2 logstash-to-kafka[root@ZooKeeper-Kafka-01 config]# cat logstash.confinput {  beats {    host => "0.0.0.0"    port => 5044  }}filter {  if [log_topic] !~ "^nginx_" {    drop {}  }  ruby {    code => "      require 'date'      event.set('log_filename',event.get('source').gsub(/\/.*\//,'').downcase)      #tmptime = event.get('message').split(']')[0].delete('[')      #timeobj = DateTime.parse(tmptime)      #event.set('log_timestamp',tmptime)      #event.set('log_date',timeobj.strftime('%Y-%m-%d'))      #event.set('log_year',timeobj.year)      #event.set('log_time_arr',[timeobj.year,timeobj.month,timeobj.day,timeobj.hour,timeobj.minute])        "    }    #date {    #    match => [ "log_timestamp" , "ISO8601" ]    #}     mutate {        remove_field => [ "source" ]        remove_field => [ "host" ]        #remove_field =>["message"]    }}output {  stdout {    codec => rubydebug  }  kafka {    bootstrap_servers => "10.200.3.85:9092,10.200.3.86:9092,10.200.3.87:9092"    topic_id => "%{log_topic}"    codec => json {}  }# elasticsearch {#    hosts => ["10.200.3.90:9200","10.200.3.91:9200","10.200.3.92:9200"]#    index => "logstash-%{log_filename}-%{+YYYY.MM.dd}"#    template_overwrite => true##  }}

nginx日志过滤和转发

[root@ZooKeeper-Kafka-02 config]# cat logstash.confinput {  beats {    host => "0.0.0.0"    port => 5044  }}filter {  if [log_topic] !~ "^tomcat_"{    drop {}  }  ruby {    code => "      require 'date'      event.set('log_filename',event.get('source').gsub(/\/.*\//,'').downcase)      #tmptime = event.get('message').split(']')[0].delete('[')      #timeobj = DateTime.parse(tmptime)      #event.set('log_timestamp',tmptime)      #event.set('log_date',timeobj.strftime('%Y-%m-%d'))      #event.set('log_year',timeobj.year)      #event.set('log_time_arr',[timeobj.year,timeobj.month,timeobj.day,timeobj.hour,timeobj.minute])        "    }    #date {    #    match => [ "log_timestamp" , "ISO8601" ]    #}   mutate {        remove_field => [ "host" ]        remove_field =>["source"]    }}output {  stdout {    codec => rubydebug  }  kafka {    bootstrap_servers => "10.200.3.85:9092,10.200.3.86:9092,10.200.3.87:9092"    topic_id => "%{log_topic}"    codec => json {} }}[root@ZooKeeper-Kafka-02 config]#

tomcat日志收集及转发

转发层logstash安装,logstash从kafka读取日志写入到es中(10.200.3.88、10.200.3.89)

[root@logstash-01 src]# tar -zxvf logstash-5.6.2.tar.gz -C /usr/local/[root@logstash-01 src]# cd /usr/local/[root@logstash-01 local]# ln -s logstash-5.6.2 logstash-to-es[root@logstash-01 config]# cat logstash.conf input {  kafka {    bootstrap_servers => "ZooKeeper-Kafka-01:9092,ZooKeeper-Kafka-02:9092,ZooKeeper-Kafka-03:9092"    #bootstrap_servers => "10.200.3.85:9092,10.200.3.86:9092,10.200.3.87:9092"    group_id => "nginx_logs"    topics  => ["nginx_logs"]    consumer_threads => 5     decorate_events => true     codec => json {}  }}filter {  if [log_filename] =~ "_access.log"  {    grok {      patterns_dir => "./patterns"      match => { "message" => "%{NGINXACCESS}" }        }  } else {    drop {}  }  mutate {    remove_field => [ "log_time_arr" ]  }}output {  stdout {    codec => rubydebug  }  elasticsearch {    hosts => ["10.200.3.90:9200","10.200.3.91:9200","10.200.3.92:9200"]    index => "logstash-%{log_filename}-%{+YYYY.MM.dd}"    template_overwrite => true    flush_size=>2000  }}[root@logstash-01 config]#

从kafka读取nginx日志，转发存储到es中

[root@logstash-02 patterns]# cat nginx_access ERNAME [a-zA-Z\.\@\-\+_%]+NGUSER %{NGUSERNAME}NGINXACCESS \[%{TIMESTAMP_ISO8601:log_timestamp1}\] %{IPORHOST:clientip} - %{NOTSPACE:remote_user} \[%{HTTPDATE:timestamp}\] \"(?:%{WORD:verb} %{NOTSPACE:request}(?: HTTP/%{NUMBER:httpversion})?|%{DATA:rawrequest})\" %{NUMBER:response} (?:%{NUMBER:bytes}|-) %{QS:referrer} %{QS:agent} %{NOTSPACE:http_x_forwarded_for}######################################Nginx.conf端配置格式:log_format  main  '[$time_iso8601] $remote_addr - $remote_user "$request" '            '$status $body_bytes_sent "$http_referer" '            '"$http_user_agent" "$http_x_forwarded_for"';

Nginx日志格式如下

[root@logstash-02 config]# cat logstash.confinput {  kafka {    bootstrap_servers => "ZooKeeper-Kafka-01:9092,ZooKeeper-Kafka-02:9092,ZooKeeper-Kafka-03:9092"    #bootstrap_servers => "10.200.3.85:9092,10.200.3.86:9092,10.200.3.87:9092"    group_id => "tomcat_logs"    topics  => ["tomcat_logs"]    consumer_threads => 5    decorate_events => true    codec => json {}  }}filter {    grok {    patterns_dir => "./patterns"    match => { "message" => "%{CATALINALOG}" }            }           mutate {    remove_field => [ "log_time_arr" ]  }}output {  stdout {    codec => rubydebug  }    elasticsearch {    hosts => ["10.200.3.90:9200","10.200.3.91:9200","10.200.3.92:9200"]    index => "logstash-%{project_name}-%{log_filename}-%{+YYYY.MM.dd}"    template_overwrite => true    flush_size=>2000  }}[root@logstash-02 config]#

从kafka读取tomcat日志，转发存储到es中

[root@logstash-02 logstash-to-es]# cat patterns/java_access JAVACLASS (?:[a-zA-Z$_][a-zA-Z$_0-9]*\.)*[a-zA-Z$_][a-zA-Z$_0-9]*#Space is an allowed character to match special cases like 'Native Method' or 'Unknown Source'JAVAFILE (?:[A-Za-z0-9_. -]+)#Allow special 
      
        methodJAVAMETHOD (?:(
       
        )|[a-zA-Z$_][a-zA-Z$_0-9]*)#Line number is optional in special cases 'Native method' or 'Unknown source'JAVASTACKTRACEPART %{SPACE}at %{JAVACLASS:class}\.%{JAVAMETHOD:method}\(%{JAVAFILE:file}(?::%{NUMBER:line})?\)# Java LogsJAVATHREAD (?:[A-Z]{
    2}-Processor[\d]+)JAVACLASS (?:[a-zA-Z0-9-]+\.)+[A-Za-z0-9$]+JAVAFILE (?:[A-Za-z0-9_.-]+)JAVASTACKTRACEPART at %{JAVACLASS:class}\.%{WORD:method}\(%{JAVAFILE:file}:%{NUMBER:line}\)JAVALOGMESSAGE (.*)# MMM dd, yyyy HH:mm:ss eg: Jan 9, 2014 7:13:13 AMCATALINA_DATESTAMP %{MONTH} %{MONTHDAY}, 20%{YEAR} %{HOUR}:?%{MINUTE}(?::?%{SECOND}) (?:AM|PM)# yyyy-MM-dd HH:mm:ss,SSS ZZZ eg: 2014-01-09 17:32:25,527 -0800TOMCAT_DATESTAMP 20%{YEAR}-%{MONTHNUM}-%{MONTHDAY} %{HOUR}:?%{MINUTE}(?::?%{SECOND}) %{ISO8601_TIMEZONE}CATALINALOG %{CATALINA_DATESTAMP:timestamp} %{JAVACLASS:class} %{JAVALOGMESSAGE:logmessage}# 2014-01-09 20:03:28,269 -0800 | ERROR | com.example.service.ExampleService - something compeletely unexpected happened...TOMCATLOG \[%{TOMCAT_DATESTAMP:timestamp}\] \| %{LOGLEVEL:level} \| %{JAVACLASS:class} - %{JAVALOGMESSAGE:logmessage}# 2016-04-10 07:19:16-|INFO|-Root WebApplicationContext: initialization startedMYTIMESTAMP 20%{YEAR}-%{MONTHNUM}-%{MONTHDAY} %{HOUR}:%{MINUTE}:%{SECOND}MYLOG %{MYTIMESTAMP:mytimestamp}-\|%{LOGLEVEL:level}\|-%{JAVALOGMESSAGE:logmsg}ACCESSIP (?:[0-9]{
    1,3}\.[0-9]{
    1,3}\.[0-9]{
    1,3}\.[0-9]{
    1,3})ACCESSTIMESTAMP %{MONTHDAY}\/%{MONTH}\/20%{YEAR}:%{HOUR}:%{MINUTE}:%{SECOND} %{ISO8601_TIMEZONE}HTTPMETHOD (GET|POST|PUT|DELETE)PRJNAME ([^\s]*)HTTPVERSION (https?\/[0-9]{
    1}\.[0-9]{
    1})STATUSCODE ([0-9]{
    3})# 192.168.1.101 - - [10/Apr/2016:08:31:34 +0800] "GET /spring-mvc-showcase HTTP/1.1" 302 -ACCESSLOG %{ACCESSIP:accIP}\s-\s\-\s\[%{ACCESSTIMESTAMP:accstamp}\]\s"%{HTTPMETHOD:method}\s\/%{PRJNAME:prjName}\s%{JAVALOGMESSAGE:statusCode}JAVA_OUT_COMMON \[%{TIMESTAMP_ISO8601:log_timestamp1}\] \| %{NOVERTICALBAR:loglevel} \| %{NOVERTICALBAR:codelocation} \| %{NOVERTICALBAR:threadid} \| %{NOVERTICALBAR:optype} \| %{NOVERTICALBAR:userid} \| %{NOVERTICALBAR:phone} \| %{NOVERTICALBAR:fd1} \| %{NOVERTICALBAR:fd2} \| %{NOVERTICALBAR:fd3} \| %{NOVERTICALBAR:fd4} \| %{NOVERTICALBAR:fd5} \| %{NOVERTICALBAR:fd6} \| %{NOVERTICALBAR:fd7} \| %{NOVERTICALBAR:fd8} \| %{NOVERTICALBAR:fd9} \| %{NOVERTICALBAR:fd10} \| %{NOVERTICALBAR:fd11} \| %{NOVERTICALBAR:fd12} \| %{NOVERTICALBAR:fd13} \| %{NOVERTICALBAR:fd14} \| %{NOVERTICALBAR:fd15} \| %{NOVERTICALBAR:fd16} \| %{NOVERTICALBAR:fd17} \| %{NOVERTICALBAR:fd18} \| %{GREEDYDATA:msg}[root@logstash-02 logstash-to-es]#

tomcat中papatterns日志格式

启动logstash服务

#./bin/logstash -f logstash.conf

至此logstash安装和配置完成.

五、客户端日志收集

filebeat安装及收集Nginx端日志(10.20.9.31)：

官方文档： https://www.elastic.co/guide/en/beats/filebeat/5.6/filebeat-installation.html

下载安装软件：

#curl -L -O https://artifacts.elastic.co/downloads/beats/filebeat/filebeat-5.6.8-x86_64.rpm#rpm -vi filebeat-5.6.8-x86_64.rpm

配置：

[root@v05-app-nginx01 ~]# vim /etc/filebeat/filebeat.yml ###################### Filebeat Configuration ##########################=========================== Filebeat prospectors =============================filebeat.prospectors:- input_type: log  document_type: nginx_access  paths:    - /opt/ytd_logs/nginx/*_access.log  fields_under_root: true  fields:    log_source: 10.20.9.31    log_topic: nginx_logs  tags: ["nginx","webservers"]  multiline:    pattern: ^\[[0-9]{4}-[0-9]{2}-[0-9]{2}T    match: after    negate: true#----------------------------- Logstash output --------------------------------output.logstash:  # The Logstash hosts  hosts: ["10.200.3.85:5044"]

测试配置文件:

/usr/bin/filebeat.sh -configtest –e

启动服务

# /etc/init.d/filebeat start

filebeat安装及收集tomcat 端日志(10.20.9.52)：

1.安装略，配置文件如下.

[root@v05-app-test01 filebeat]# vim filebeat.yml###################### Filebeat Configuration ##########################=========================== Filebeat prospectors =============================#filebeat.prospectors:- input_type: log  document_type: java_access  paths:    - /opt/logs/portal/catalina.2018-*.out  fields_under_root: true  fields:    log_source: 10.20.9.52    log_topic: tomcat_logs    project_name: app_01  tags: ["tomcat","javalogs"]  multiline:    #对日志按时间进行一条条分割    #pattern: ^\[[0-9]{
   4}-[0-9]{
   2}-[0-9]{
   2}T    pattern: ^\[[0-9]{
   4}-[0-9]{
   2}-[0-9]{
   2}[ ][0-2][0-9]:[0-9]{
   2}:[0-9]{
   2}    #pattern: ^\[    match: after    negate: true#----------------------------- Logstash output --------------------------------output.logstash:  # The Logstash hosts  hosts: ["10.200.3.86:5044"]

至此，ELK+Filebeat+Kafka+ZooKeeper日志收集系统部署完成!!!

kibana使用的lucene查询语法：

链接文档：

转载地址：http://oyrma.baihongyu.com/

你可能感兴趣的文章

CentOS下如何从vi编辑器插入模式退出到命令模式

查看>>

Mysql索引的类型

查看>>

Eclipse debug模式总是进入processWorkerExit

查看>>

Nginx的https配置记录以及http强制跳转到https的方法梳理