一 监控架构
1.1 组成
客户端:数据采集部分
服务端:数据存储分析告警展示
1.2 采集模式
被动模式:服务器端到客户端采集数据,对服务器的开销较大,适合小规模的监控环境。
主动模式:客户端主动上报数据到服务器端,对服务器的开销较小,适合大规模的监控环境。
1.4 协议
专用客户端采集
公用协议采集:snmp/ssh/telnet
1.5 架构
c/s架构:被监控节点较少,产生的数据较少。
c/p/s架构:被监控节点较多,监控类型复杂,产生的数据和网络连接开销很大,跨地域等环境下。
二 常见监控软件
流量监控:mtrg、cacti、smokeping、graphite等
性能告警:nagios、zabbix、zenoss、core、ganglia、opentsdb等
三 常见监控内容
监控项目
|
描述
|
主机监控
|
cpu、内存、磁盘的剩余空间/利用率和i/o、swap使用率、系统up时间、进程数、负载
|
网卡监控
|
ping的往返时间及包成功率、网卡流量,包括流入/流出量和错误的数据包数
|
文件监控
|
监控文件大小、hash值,匹配查询、字符串存在与否
|
url监控
|
监测制定url访问过程中的返回码、下载时间及文件大小,支持内容匹配
|
应用程序
|
端口和内存使用率、cpu使用率、服务状态、请求数、并发连接数、
消息队列的字节数、client事务处理数、service状态等
|
数据库
|
指定的表空间、游标数、session数、事务数、死锁数、缓冲池命中率、库cache命中率、
当前连接数、进程的内存利用率等性能参数
|
日志
|
错误日志匹配,特定字符串匹配
|
硬件
|
温度、风扇转速、电压等
|
四 其他需求
4.1 时间需求
监控系统应根据实际情况,实时/非实时的采集和展示数据,包括历史趋势数据展示、分析,容量报表、可用性报告等。
4.2 告警需求
支持多种方式,邮件、短信、im和其他接口,具有可定制化功能。
只是对告警内容分析自动处理,防止误报、漏报、抖动等。
如对本文有疑问,
点击进行留言回复!!
网友评论