摘要:在互联网信息爆炸式快速发展的今天,各类复杂多样的平台系统相继涌出。如何选择**的监控产品以更好地维护这些平台和系统是每个 IT 人员都需面临的难题。本文将从开源监控产品的起源和发展,详细解析各个时代热门监控产品的优势和劣势,并结合各个监控产品的使用场景,帮你选择出***适合自己的开源监控产品。因篇幅和时间原因,下面介绍的资料和理解可能和实际情况有所偏差,欢迎大家留言或者加入微信群批评指正。
作者:Ethan Chen 云智慧解决方案架构师,拥有丰富的运维理论及实战经验。致力于将客户需求有效地转化为公司产品场景,让客户更有效率地理解公司产品并为其提供优质的技术支撑。
Zabbix于1998年开发,2004年正式Release。较于其他开源监控产品,Zabbix拥有强大的指标数据存储功能、画图功能,并且真正地做到了All in One全面监控,解决了运维人力和时间成本上的问题。
丰富的插件。Zabbix拥有丰富的MiB库资源以及模版等850多个插件;
易用性、依赖少。基于PHP与MySQL搭建,可用性比较强;
可进行一定颗粒度的权限控制;
文档完善。Zabbix本身定位为企业级分布式监控系统,故拥有完善的文档,活跃的官方社区,且本身也更新得比较频繁,开发比较积极;
国内市场有相关的商业支持。
MySQL数据量问题。当MySQL数据量比较大时,存储性能容易出现问题;
可视化问题。自身可视化灵活性较差,需用Grafana等进行弥补;
监控基础设施。主机、网络设备监控等;
中小规模监控;
Nagios是一个主要用于监控系统运行状态和网络信息的监控系统。Nagios能监控所指定的本地或远程主机以及服务,同时提供异常通知等功能。
Nagios拥有4000多个插件,且在很早之前就开始拥有自己的官方插件社区。这里面包括很多应用级别的监控插件。此外,Nagios的通知虽然简单但能覆盖所有场景,以及本身拥有强大的监控任务调度的能力。
功能过于单一,只能通过主动检测告知结果是否匹配,被动检测功能原生功能较弱;
小场景简单监控。对于一些网站、端口等可进行简单监控;
Centreon是一款开源的软件,主要用于对Nagios的一些功能增强。可通过页面管理Nagios,通过第三方插件实现对网络,操作系统,应用程序的监控。
界面友好
维护方便
统一管理
修改配置需要重启或者重载Nagios主进程
MySQL依然存在数据问题
适用于百台规模的中等监控
Check_MK是一款通用的Nagios/Icinga增强工具集。其插件有着相当成熟的检测机制和对硬件服务器的检测手段。非常适合对硬件服务器进行“体检”。
界面友好
维护方便
统一管理
增加变更需要重启Nagios主进程。
因后端存储使用RRD,导致分布式扩展较为困难。
适用于百台到千台以内中等规模监控
网络设备支持好
有权限控制
有汉化版
资料老旧
简单的IDC托管
网络运维
Ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。主要是用来监控系统性能,如:CPU 、内存、硬盘利用率, I/O负载、网络流量情况等。
数据集中,部署分布式
适合大规模部署
对集群热点观测性支持较好
大数据应用
监控宝是云智慧推出的新一代用户体验监控工具,从全球节点主动模拟真实用户访问,提供网站性能监控、API监控等服务,持续监测应用程序、网站、网络和数字化服务的可用性和性能,提前诊断,实时告警,帮助客户提升网络应用效能。
专业的分析报告。提供综合排名、竞品分析、同比/环比、日/周报等多维度的数据报告,满足专业化定制需求。
API接口监测。通过监控API接口的响应时间、可用性和正确性并及时告警来保证API服务的可靠性,可用于API接口性能优化、第三方API接口监控等使用场景。
Graphite是一个开源实时的、显示时间序列度量数据的图形系统,通过其后端接收度量数据,然后以实时方式查询、转换、组合这些度量数据。
指标点分概念引入
Grafana支持较早的协议之一
统计函数支持(140+)
指标无Label支持
在做好数据归并时可用于大规模场景
Prometheus 是由 SoundCloud 开源的监控告警解决方案。存储的是时序数据,即按相同时序(相同名称和标签),以时间维度存储连续的数据的集合。
时序型存储、查询效率高。
支持集群模式,扩展性强。
一些Exporter采集的指标众多,需进行适当裁剪。
自定义采集脚本需要脚本开发能力(Golang、Python),相比Shell脚本来说学习成本更高一些。
对于云计算、容器化场景更适合
夜莺是一套分布式高可用的运维监控系统,前身是国内大名鼎鼎的open-falcon。基于一些国内特殊的运维场景和习惯,在运维圈中有着不俗的场景理解和用户体验。
社区活跃,有open-falcon群众基础。
产品设计灵活,人性化。
v4版本自带小型CMDB和自动化。
v5版本全面拥抱开源体系(Prometheus Telegraf)。
v5刚发布,仍然需要一定的时间积累
后端存储的选型多样,需要根据场景进行选择
缺少日志类和Tracing类的监控场景
往期精彩回顾
河北亚特尔弱电公司做为京津冀一流的安防监控公司,专注、安防工程、监控公司、安防系统、安防监控十八年,经验丰富,成功案例覆盖京津冀地区,为客户提供咨询、规划、设计、施工、运维一站式解决方案,咨询电话:400-0330-600!更多弱电安防资讯 请访问河北亚特尔:http://www.yater.cn/