网关自愈

概念 openclaw 运维 高可用 来源数 1 Fri Apr 10 2026 08:00:00 GMT+0800 (China Standard Time)

网关自愈

为 OpenClaw Gateway 设计的「起搏器」机制,防止网关进程崩溃或断联后无人修复,实现三层防护的高可用方案。

三层防护体系

  1. 进程守护(秒级):macOS launchd / Linux systemd 在进程挂掉时自动重启。
  2. 修复 Session(智能级):由外部 Cron 触发独立的修复 Session,分析日志、重启网关、发送通知;通过严格白名单控制权限(禁止 rm -rf 和配置修改)。
  3. 人工介入(最终保障):自动修复失败时发送飞书告警,等待人工处理。

核心设计原则

  • 外部监控:Cron 独立于 OpenClaw 运行,避免「网关挂了监控也挂」的单点故障。
  • 权限最小化:修复 Session 只能执行 gateway status/start/stop/restart 和日志查看命令。
  • 渐进式恢复:先自动重启,再智能诊断,最后人工兜底。

来源