src-SLM-Skills分类评测标准
来源 slm skill 评测 方法论
来源数 1 Sat Apr 11 2026 08:00:00 GMT+0800 (China Standard Time)
src-SLM-Skills分类评测标准
原始来源: raw/project-docs/SLM-Skills分类评测标准.md
作者: 水的离子积
日期: 2026-04-11
一句话摘要
将 28 个 Skill 按输出形态分为 5 大类(笔记生产型、学习工具型、洞察分析型、操作执行型、Meta 型),并为每类配置独立的 note_judge 维度与权重。
关键收获
- 笔记生产型(
content-creator、doc-importer等):Structure/Density/Links/Actionability/Fidelity 五维全量评估。 - 学习工具型(
flashcards、lesson-plan等):以 QA Pair Quality 和 Actionability 为核心,Links 弱化。 - 洞察分析型(
ie-engine、connect-dots等):Insight Soundness 与 Links 权重最高,强调跨笔记证据链。 - 操作执行型(
wechat-publisher、coding-assistant等):以 Task Completeness、Tool-Use Accuracy、Intent Accuracy 为核心。 - Meta 型(
learning-assistant):不适用标准 note_judge,改用 Workflow Completion Rate 和 Skill Routing Accuracy。
提及的概念
- skill-creator
content-creatordoc-importerweb-importerliterature-readercoding-assistantwechat-publisher- SLM(Skills Lifecycle Management)