运行监控

运行监控用于持续采集设备状态,并根据规则产生告警和通知。

入口:

1
监控管理

菜单

  1. 监控项
  2. 监控总览
  3. 监控看板
  4. 告警中心
  5. 策略与通知

监控项

监控项定义“监控哪些设备、采集什么指标、如何判断异常”。

常见类型:

  • Ping 连通性
  • SNMP OID 指标
  • 设备在线状态
  • 自定义阈值指标

配置建议:

  • 先从少量关键设备开始配置。
  • 采集间隔不要过短。
  • 阈值应结合设备实际运行情况设置。
  • SNMP 监控前先确认设备 SNMP 参数和接口发现正常。

监控总览

用于查看监控项整体状态,包括正常、异常、未采集、最近采集时间等。

监控看板

用于展示重点设备和指标,适合值班大屏或日常巡检页面。

告警中心

告警中心用于查看当前告警和历史告警。处理告警时建议关注:

  • 告警设备
  • 监控项
  • 触发时间
  • 当前值
  • 阈值
  • 恢复状态

策略与通知

告警通知支持:

  • 企业微信机器人
  • 钉钉机器人
  • 飞书机器人
  • 通用 Webhook
  • 邮件通道

建议先使用“测试连通性”和“发送测试消息”验证通知链路,再启用生产告警。