运行监控
运行监控用于持续采集设备状态,并根据规则产生告警和通知。
入口:
1 | 监控管理 |
菜单
- 监控项
- 监控总览
- 监控看板
- 告警中心
- 策略与通知
监控项
监控项定义“监控哪些设备、采集什么指标、如何判断异常”。
常见类型:
- Ping 连通性
- SNMP OID 指标
- 设备在线状态
- 自定义阈值指标
配置建议:
- 先从少量关键设备开始配置。
- 采集间隔不要过短。
- 阈值应结合设备实际运行情况设置。
- SNMP 监控前先确认设备 SNMP 参数和接口发现正常。
监控总览
用于查看监控项整体状态,包括正常、异常、未采集、最近采集时间等。
监控看板
用于展示重点设备和指标,适合值班大屏或日常巡检页面。
告警中心
告警中心用于查看当前告警和历史告警。处理告警时建议关注:
- 告警设备
- 监控项
- 触发时间
- 当前值
- 阈值
- 恢复状态
策略与通知
告警通知支持:
- 企业微信机器人
- 钉钉机器人
- 飞书机器人
- 通用 Webhook
- 邮件通道
建议先使用“测试连通性”和“发送测试消息”验证通知链路,再启用生产告警。