| created_date | 2020-11-16 |
|---|
[TOC]
参考文档 https://my.oschina.net/u/4278828/blog/3200478/print
-
针对不同场景把监控系统分为三类
- 日志类 Log
- 调用链类 全链路监控
- 度量类 Metric
-
监控系统的分层
- 客户端监控
- 业务层监控
- 应用层监控
- 系统层监控
- 内存
- CPU
- 存储:硬盘掉线 硬盘读写错误 读写超时
- 网络层监控
- 流量速率
- 硬件层
-
安全监控
Prometheus Zabbix
时序数据库 Rrometheus
监控是基础设施,目的是为了解决问题,不要只朝着大而全去做,尤其是不必要的指标采集,浪费人力和存储资源(To B商业产品例外)。
需要处理的告警才发出来,发出来的告警必须得到处理。
简单的架构就是最好的架构,业务系统都挂了,监控也不能挂。
接口的 RT