src-SLM-Skills分类评测标准

来源 slm skill 评测 方法论 来源数 1 Sat Apr 11 2026 08:00:00 GMT+0800 (China Standard Time)

src-SLM-Skills分类评测标准

原始来源: raw/project-docs/SLM-Skills分类评测标准.md
作者: 水的离子积
日期: 2026-04-11

一句话摘要

将 28 个 Skill 按输出形态分为 5 大类(笔记生产型、学习工具型、洞察分析型、操作执行型、Meta 型),并为每类配置独立的 note_judge 维度与权重。

关键收获

  1. 笔记生产型content-creatordoc-importer 等):Structure/Density/Links/Actionability/Fidelity 五维全量评估。
  2. 学习工具型flashcardslesson-plan 等):以 QA Pair Quality 和 Actionability 为核心,Links 弱化。
  3. 洞察分析型ie-engineconnect-dots 等):Insight Soundness 与 Links 权重最高,强调跨笔记证据链。
  4. 操作执行型wechat-publishercoding-assistant 等):以 Task Completeness、Tool-Use Accuracy、Intent Accuracy 为核心。
  5. Meta 型learning-assistant):不适用标准 note_judge,改用 Workflow Completion Rate 和 Skill Routing Accuracy。

提及的概念

  • skill-creator
  • content-creator
  • doc-importer
  • web-importer
  • literature-reader
  • coding-assistant
  • wechat-publisher
  • SLM(Skills Lifecycle Management)