监控与健康信号

你无法修复你看不到的问题。

应该监控什么

  • 进程健康
  • 任务失败
  • 错误率
  • 执行延迟
  • 队列积压(如有)

基本健康检查模式

进程是否存活?

OpenClaw 守护进程或服务正在运行

任务是否在完成?

任务在预期时间范围内完成

错误是否在增加?

错误率保持在可接受范围内

输出是否意外停止?

没有意外停顿的活动

告警与通知

⚠️避免告警疲劳 — 只在真正的故障时告警
  • 在故障时告警,而非噪音
  • 将告警路由到你实际检查的渠道
  • 避免告警疲劳

当出现问题

步骤

  1. 检查日志
  2. 识别最近的变更
  3. 安全重启
  4. 仅在重复时升级
OpenClaw Hub | openclawskill