Skip to content

Latest commit

 

History

History
56 lines (36 loc) · 1 KB

File metadata and controls

56 lines (36 loc) · 1 KB
created_date 2020-11-16

[TOC]

监控系统

监控划分

参考文档 https://my.oschina.net/u/4278828/blog/3200478/print

  1. 针对不同场景把监控系统分为三类

    • 日志类 Log
    • 调用链类 全链路监控
    • 度量类 Metric
  2. 监控系统的分层

    1. 客户端监控
    2. 业务层监控
    3. 应用层监控
    4. 系统层监控
      • 内存
      • CPU
      • 存储:硬盘掉线 硬盘读写错误 读写超时
    5. 网络层监控
      • 流量速率
    6. 硬件层
  3. 安全监控

监控规划

收集数据

Prometheus Zabbix

数据存储

时序数据库 Rrometheus

监控是基础设施,目的是为了解决问题,不要只朝着大而全去做,尤其是不必要的指标采集,浪费人力和存储资源(To B商业产品例外)。

需要处理的告警才发出来,发出来的告警必须得到处理。

简单的架构就是最好的架构,业务系统都挂了,监控也不能挂。

接口监控

接口的 RT