大型互联网平台日志系统(FileBeat+Kafka+LogStash+Elastic+Storm+MySql)小白的入门实战篇

大型互联网平台日志系统(FileBeat+Kafka+LogStash+Elastic+Storm+MySql)小白从入门实战篇

原计划昨天的公众号图文直播因公司年会抽奖而没有进行，今天在自己的电脑上实战了FileBeat+Kafka+LogStash+Elastic+Storm+MySql的环境搭建，由于今天的实验过程并不顺利，所以整体实验方案砍掉了Storm、MySql，这将是明天的套餐。

作为一个有态度的资深公众号运营人员，写一篇文章不仅会为了达到原创标准凑够300字，同时也会把本次实战的心得与经验放到前面，让小伙伴能以最快的速度收获一些经验性的东西。同时，实战是一步一步操作，并跑并跑起来，是在坑里爬了很久，才写出来的，如果你有兴趣可以照着做一篇，是可以跑起来。看不明白的，可以留言问，包教包会~

完整的读完本实验总结，可以有以下收获：

能搭建互联网平台日志收集系统
能知道如何处理开源产品配置报错

本次实战的小心得如下：

玩开源产品，版本多，不要怕提示出错，网上多找找，一般都能找到答案。
这不是在堆代码，只是使用开源的产品，不需要编程功力。
先了解一下相关产品的设计思路，用得思路会更好些

本次实验用到的开源产品：

elasticsearch-6.5.4

elasticsearch-head

filebeat-6.5.4-windows-x86_64

kafka_2.12-2.1.0

logstash-6.6.0

zookeeper-3.4.12

autovisit.bat （这个一小段脚本，用来不断访问页面，以产生访问日志，自己DIY也可以，很简单。加头我放到Github上吸粉）

本次实现新增加了Kafka\LogStash\zookeeper，先来看一下实现录的小视频，直观的感受一波操作。

关注公众号 Yuema约吗可以查看录制的视频

一、zookeeper

kafka用zookeeper来协调集群节点，apache下很多开源产品都是用zookeeper来协调集群节点。知道这么回事就好。本次实战就不讲原理了，感兴趣的小伙伴可以去查资料。跑命令 zkServer.cmd 启动！配置文件：zookeeper-3.4.12\zookeeper-3.4.12-1\conf\zoo.cfg [把zoo_sample.cfg修改成zoo.cfg]，用单机模拟的集群，所以后面有带了三个节点配置。纯体验的话，可以去掉，直接跑单机，看到的效果是一样的。

zookeeper_config

#存储内存中数据库快照的位置，如果不设置参数，更新事务日志将被存储到默认位置。

dataDir=../zookeeperData

#日志文件的位置

dataLogDir=../zookeeperLog

#mock a cluster

server.1=127.0.0.1:12888:1388

server.2=127.0.0.1:12889:1389

server.3=127.0.0.1:12887:1387