Back to feed

kangarooking/cangjie-skill

kangarooking/cangjie-skill
486
+37/day
93

把一本书蒸馏成一组可执行的 Agent Skills

From the README

Cangjie Skill

把一本书蒸馏成一组可执行的 Agent Skills。

为什么做这件事

最近有一个很火的 idea:把同事蒸馏成 skill。即便一个人离职了,他的经验、语气、工作方式都会被 AI 一定程度替代。nuwa-skill 就是做这件事的——创造"人类 skill",比如马斯克 skill、巴菲特 skill。配套的 darwin-skill 负责让这些 skill 自动进化。

蒸馏人很有价值——nuwa-skill 已经证明了这一点。而蒸馏人写过的东西,则是另一个维度的补充:一本书是作者花很长时间沉淀下来的思考,是深思熟虑后的精华。比起模仿一个人的表达方式,把他系统性输出的方法论拆出来、变成可以帮人解决实际问题的工具,同样是很有价值的事。

而且还有一个真实的痛点:你可能看了很多书,但就是运用不起来。把书蒸馏成 skill 之后,AI agent 可以帮你在真实场景中调用这些知识,而不是让它们躺在笔记里落灰。

所以 cangjie-skill 的目标很明确:蒸馏所有值得蒸馏的书,把每一本高价值的书变成一套可独立调用、可组合使用、可压力测试的 AI skill 工具包。

它解决了什么问题

  • 看了很多书但用不起来——知识停留在"读过"层面,无法在真实决策中被调用
  • 书摘/读书笔记只是压缩,不是结构化复用——读完还是不知道"什么时候该用什么"
  • 一本书里真正值得变成工具的内容只有一小部分——需要严格的筛选而不是照单全收
  • 现有的读书方法论都是给人看的,不是给 agent 用的——需要面向执行而非面向阅读的蒸馏方法

它是怎么工作的

cangjie-skill 使用 RIA-TV++ 流水线,把一本书从原始文本变成一组结构化的 skill。整个过程分六个阶段:

  1. 整书理解(Adler 分析)——用 Mortimer Adler 的分析阅读法,对全书做结构、解释、批判、应用四步拆解,产出 BOOK_OVERVIEW.md
  2. 并行提取——同时派 5 个专项提取器(框架、原则、案例、反例、术语),从原文中提取候选方法论单元
  3. 三重验证筛选——每个候选必须通过三项检验:书中至少有 2 处独立佐证(跨域)、能回答书中未明说的新问题(预测力)、不是常识(独特性)。通过率通常只有 25-50%
  4. RIA++ 构造——将验证通过的内容按 R(原文引用)/ I(用自己的话重写)/ A1(书中案例)/ A2(未来触发场景)/ E(可执行步骤)/ B(边界与盲点)六个维度结构化
  5. Zettelkasten 链接——找出 skill 之间的依赖、对比、组合关系,生成 INDEX.md 和引用图
  6. 压力测试——为每个 skill 设计包含诱饵题的测试用例,未通过的回炉重做

RIA-TV++ 这个名字拆开看:

  • RIA:来自赵周《这样读书就够了》的便签拆书法(Reading / Interpretation / Appropriation)
  • TV:Triple Verification,三重验证
  • ++:面向 agent 执行的扩展——E(Execution 可执行步骤)+ B(Boundary 边界)

效果示例

示例 1:从一本书到一套 skill 工具包

用户需求

"我想把一本书里的核心方法论抽成可复用的 AI skills,而不是只做读书摘要。"

cangjie-skill 如何判断

  • 先看源材料是否存在可重复调用的方法论单元
  • 再区分哪些内容适合做独立 skill,哪些只适合做候选或背景
  • 最后输出结构化 skill 仓库,而不是一篇总结文章

最终输出示例

输出将不是一个单文件摘要,而是一个多 skill 仓库:包含 BOOK_OVERVIEW.md 作为全局理解,INDEX.md 作为技能地图,若干 */SKILL.md 作为独立模块,以及 test-prompts.json 用于验证触发场景。

示例 2:不是压缩,是结构化复用

用户需求

"我不希望这本书只变成一个很长的说明文,我想要可以在 agent 里复用的技能包。"

cangjie-skill 如何判断

  • 判断目标不是内容总结,而是结构化复用
  • 优先生成可触发、可组合、可测试的 skill 单元
  • 对没有独立价值的内容进行淘汰,不强行保留

最终输出示例

系统会把内容拆成多个带触发条件、适用边界、使用方式和关联关系的 skills,而不是把整本书压缩成一篇泛化总结。

已生成的 skill packs

| 仓库 | 来源 | Skills 数 | |------|------|-----------| | buffett-letters-skill | 巴菲特致股东的信(1957-2023) | 20 | | cognitive-dividend-skill | 《认知红利》 | 15 | | duan-yongping-skill | 段永平投资问答录(商业逻辑+投资逻辑) | 15 | | poor-charlies-almanack-skill | 《穷查理宝典》 | 12 | | no-rules-rules-skill | 《不拘一格:网飞的自由与责任工作法》 | 10 | | huangdi-neijing-skill | 《黄帝内经》(素问+灵枢) | 22 |

后续计划蒸馏更多高价值书籍。候选书单包括但不限于:毛选、君主论。

仓库结构

cangjie-skill/
├── README.md              ← 你正在看的
├── README.en.md           ← English version
├── README.ja.md           ← 日本語版
├── LICENSE                ← MIT
├── SKILL.md               ← 元 skill 定义(book2skill 的完整执行规范)
├── methodology/           ← RIA-TV++ 各阶段的方法论文档
├── extractors/            ← 5 个并行提取器的 prompt 定义
└── templates/             ← SKILL.md / INDEX.md / BOOK_OVERVIEW.md 模板

生态

cangjie-skill 是一个更大的 skill 生态的一部分:

  • nuwa-skill — 蒸馏人(思维方式、表达 DNA)
  • cangjie-skill(本仓库)— 蒸馏书(方法论、框架、原则)
  • darwin-skill — 进化任意 skil