src-网关自愈方案设计
来源 openclaw 运维 安全
来源数 1 Fri Apr 10 2026 08:00:00 GMT+0800 (China Standard Time)
src-网关自愈方案设计
原始来源: raw/tech-docs/260302-网关自愈方案设计.md
作者: 水的离子积 / 水水
日期: 2026-03-02
状态: 方案讨论完成,待实现
一句话摘要
为 OpenClaw 设计的「起搏器」机制,通过外部 Cron 监控 + 独立修复 Session + launchd 进程守护,构建三层防护体系防止网关挂掉后无人修复。
关键收获
- 核心思路:专门的修复 Session + 外部监控触发。网关断联时,由独立于 OpenClaw 的 Cron 脚本启动修复 Session。
- 修复 Session 设计:专门的 CLAUDE.md 定义白名单(
gateway status/restart/start/stop、cat/tail log)和黑名单(rm -rf、修改配置、删除操作)。 - 三层防护:
- 第 1 层:进程守护(macOS launchd / Linux systemd)——秒级恢复进程。
- 第 2 层:修复 Session(智能修复)——分析日志、重启、通知。
- 第 3 层:人工介入——自动修复失败时发送飞书告警。
- 关键挑战与解决:监控进程本身由 launchd 守护;修复 Session 失败则飞书告警+人工;权限通过严格白名单控制。
- 优化方向:根本原因分析(配置错误、内存溢出、端口冲突)、预防措施(配置保护、日志崩溃前预警、资源限制)。