src-SLM-项目进展说明

来源 slm skill 项目管理 进展 来源数 1 Sat Apr 11 2026 08:00:00 GMT+0800 (China Standard Time)

src-SLM-项目进展说明

原始来源: raw/project-docs/SLM-项目进展说明.md
作者: 水的离子积
日期: 2026-04-11

一句话摘要

Skills 全生命周期管理体系(SLM)的五大模块进展说明:测例工厂、执行引擎、笔记效果评估、生命周期管理、Dashboard & CI。

关键收获

  1. Eval Suite Factory:自动生成 easy/medium/hard 三级测试用例,skill-creator 的 eval suite 已完成,其余 27 个 Skill 正在批量生成。
  2. Execution Engine:支持 vanilla / reference / candidate 三方对比(Triangulation),triangulate.py 已完成。
  3. Note-Effect Evaluation:Agent-as-a-Judge 五维度打分 + Claims-Based Coverage Scorer 已跑通。
  4. Lifecycle Management:Registry、Security Scanner、Release Gate、Package Gate 四个脚本均已写完并跑通。28 个 Skill 全部在册,0 个高危安全问题,但 21 个 Skill 因缺少 eval suite 暂时被标记为 blocked
  5. Dashboard & CI:GitHub Actions 工作流已完成,HTML 报告待 triangulate 数据积累后扩展。

提及的概念