网关自愈
概念 openclaw 运维 高可用
来源数 1 Fri Apr 10 2026 08:00:00 GMT+0800 (China Standard Time)
网关自愈
为 OpenClaw Gateway 设计的「起搏器」机制,防止网关进程崩溃或断联后无人修复,实现三层防护的高可用方案。
三层防护体系
- 进程守护(秒级):macOS launchd / Linux systemd 在进程挂掉时自动重启。
- 修复 Session(智能级):由外部 Cron 触发独立的修复 Session,分析日志、重启网关、发送通知;通过严格白名单控制权限(禁止
rm -rf和配置修改)。 - 人工介入(最终保障):自动修复失败时发送飞书告警,等待人工处理。
核心设计原则
- 外部监控:Cron 独立于 OpenClaw 运行,避免「网关挂了监控也挂」的单点故障。
- 权限最小化:修复 Session 只能执行
gateway status/start/stop/restart和日志查看命令。 - 渐进式恢复:先自动重启,再智能诊断,最后人工兜底。