src-SLM-项目进展说明
来源 slm skill 项目管理 进展
来源数 1 Sat Apr 11 2026 08:00:00 GMT+0800 (China Standard Time)
src-SLM-项目进展说明
原始来源: raw/project-docs/SLM-项目进展说明.md
作者: 水的离子积
日期: 2026-04-11
一句话摘要
Skills 全生命周期管理体系(SLM)的五大模块进展说明:测例工厂、执行引擎、笔记效果评估、生命周期管理、Dashboard & CI。
关键收获
- Eval Suite Factory:自动生成 easy/medium/hard 三级测试用例,
skill-creator的 eval suite 已完成,其余 27 个 Skill 正在批量生成。 - Execution Engine:支持 vanilla / reference / candidate 三方对比(Triangulation),
triangulate.py已完成。 - Note-Effect Evaluation:Agent-as-a-Judge 五维度打分 + Claims-Based Coverage Scorer 已跑通。
- Lifecycle Management:Registry、Security Scanner、Release Gate、Package Gate 四个脚本均已写完并跑通。28 个 Skill 全部在册,0 个高危安全问题,但 21 个 Skill 因缺少 eval suite 暂时被标记为
blocked。 - Dashboard & CI:GitHub Actions 工作流已完成,HTML 报告待 triangulate 数据积累后扩展。
提及的概念
- skill-creator
note_judgecoverage_scorerrelease_gateregistry