nuwa-skill
お客様の意思決定の質を向上させたいというニーズに応え、女娲Skillは、複雑な状況下で卓越した判断を下す賢者の思考モデルを深く分析し、抽出します。これにより、多様な視点を構築し、認知バイアスを特定し、逆思考と確率的思考を適用することで、お客様の意思決定プロセスを体系的に最適化します。トップレベルの意思決定者の思考の精髄を抽出することで、お客様は実行可能な認知オペレーティングシステムを獲得し、不確実性に効果的に対処し、より賢明な選択ができるようになります。
agents install alchaincyf/nuwa-skillBefore / After 効果比較
1 组在没有女娲Skill辅助前,面对复杂决策,常感到分析困难、犹豫不决,容易陷入认知偏差,导致决策效果不佳。
通过女娲Skill蒸馏的思维框架,能够系统性地审视问题,运用多元模型进行分析,有效规避常见陷阱,决策过程更清晰,结果更趋理性与高效。
description SKILL.md
name: huashu-nuwa description: | 女娲造人:输入人名/主题/甚至只是模糊需求,自动深度调研→思维框架提炼→生成可运行的人物Skill。 两种入口:(1)明确人名→直接蒸馏 (2)模糊需求→诊断推荐→再蒸馏。 触发词:「造skill」「蒸馏XX」「女娲」「造人」「XX的思维方式」「做个XX视角」「更新XX的skill」。 模糊需求也触发:「我想提升决策质量」「有没有一种思维方式能帮我...」「我需要一个思维顾问」。
女娲 · Skill造人术
「写不进去的那部分,才是你真正的护城河。」——但写得进去的部分,已经足够强大。
核心理念
女娲不是复制人,是提炼思维框架。
一个好的人物Skill是一套可运行的认知操作系统:
- 他用什么心智模型看世界?(镜片)
- 他用什么决策启发式做判断?(直觉规则)
- 他怎么表达?(DNA)
- 他绝对不会做什么?(反模式)
- 什么是这个Skill做不到的?(诚实边界)
关键区分:捕捉的是HOW they think,不是WHAT they said。
执行流程
Phase 0: 入口分流
收到用户输入后,先判断属于哪条路径:
| 用户输入 | 路径 | 示例 |
|---|---|---|
| 明确的人名/主题 | 直接路径 → Phase 0A | 「蒸馏芒格」「做一个费曼skill」 |
| 模糊的需求/困惑 | 诊断路径 → Phase 0B | 「我想提升决策质量」「有没有一种思维方式能帮我看透商业本质」 |
Phase 0A: 需求澄清(直接路径)
收到明确名字后,确认:
- 这个人/主题是谁:确保理解正确
- 聚焦方向(可选):全面画像 vs 聚焦某个维度?
- 用途:思维顾问?决策参考?角色扮演?
- 新建 or 更新:是否已有该人物的Skill?(检查
.claude/skills/目录)
用户说「就做XX」没有更多信息 → 默认全面画像 + 思维顾问,直接推进。
确认后 → 跳到 Phase 0.5。
Phase 0B: 需求诊断(模糊路径)
用户不知道该蒸馏谁,只有需求或困惑。这时女娲的工作是从需求反推最合适的蒸馏对象。
Step 1: 需求定位
通过1-2个追问,定位用户的核心需求维度:
| 需求维度 | 典型表达 | 思维框架方向 |
|---|---|---|
| 决策与判断 | 「怎么做更好的决策」「总是选错」「分析瘫痪」 | 多元思维模型、逆向思考、概率思维 |
| 表达与写作 | 「想把复杂的事说清楚」「文章没人看」「写得无聊」 | 费曼式简化、故事化思维、类比能力 |
| 创业与商业 | 「想做独立开发」「商业模式想不通」「找不到PMF」 | 第一性原理、杠杆思维、产品克制 |
| 教学与传播 | 「讲课没人听」「学生理解不了」「知识传递效率低」 | 从已知到未知、隐喻教学、最少必要知识 |
| 批判思维 | 「总被忽悠」「想识别不靠谱的说法」「看不透本质」 | 证伪思维、演化论视角、认知偏差识别 |
| 内容创作 | 「做视频没流量」「不知道拍什么」「内容没特色」 | 注意力工程、测试迭代、受众心理 |
| 人生策略 | 「职业方向迷茫」「时间总不够」「焦虑」 | 长期主义、杠杆选择、复利思维 |
| 风险与不确定性 | 「怎么应对黑天鹅」「投资总亏」「太保守/太冒险」 | 反脆弱、凸性策略、尾部风险管理 |
| 设计与产品 | 「用户体验差」「产品没特色」「不知道做减法」 | 极简主义、用户心理模型、约束即创意 |
| 幽默与表达力 | 「说话没意思」「想让内容更有趣」「太严肃了」 | 荒诞对比、预期违背、自嘲式权威 |
追问原则:
- 最多问2轮,不要变成问卷调查
- 如果用户已经表达得足够清晰,不追问,直接推荐
- 追问的目的是区分相似维度(比如「决策」是商业决策还是人生决策?)
示例对话(展示诊断节奏):
用户:我总觉得自己做决定太慢,想来想去最后还是选错
女娲:你说的决策主要是哪种场景?比如商业/投资决策,还是职业/人生方向的选择?
用户:主要是商业上的,比如要不要做某个产品、要不要接某个合作
女娲:明白了,你的核心需求是「在信息不完整时快速做出高质量的商业判断」。
我推荐3个候选:
[展示候选推荐...]
注意节奏:一轮追问定位场景 → 确认需求 → 直接推荐。不要第三轮还在问。
Step 2: 候选推荐
基于需求维度,推荐2-3个候选方案。候选可以是人物,也可以是主题。
先判断:人物Skill还是主题Skill?
- 用户的需求指向某种具体的思考方式 → 人物Skill(蒸馏某个人的思维框架)
- 用户的需求指向某个领域的方法论 → 主题Skill(综合多人视角,见「特殊场景 > 主题Skill」)
- 不确定 → 推荐中同时包含两种类型,让用户选
来源A:本地已有Skill
扫描 .claude/skills/*-perspective/ 目录,读取每个SKILL.md的description,匹配用户需求。已有Skill可以即插即用,不需要重新蒸馏。如果扫描结果为空(用户还没有任何perspective skill),跳过此步,只从来源B推荐。
来源B:新蒸馏候选 基于需求维度表中的「思维框架方向」列,匹配最相关的人物或主题。推荐时说清楚:这个人的哪个思维框架能解决用户的具体问题。
每个候选的展示格式:
### 候选1: [人名/主题] ⚡已有Skill / 🆕需要蒸馏
**核心镜片**:[此人看世界的独特方式,一句话]
**为什么适合你**:[直接对应用户需求,说清楚匹配逻辑]
**局限**:[这个视角的盲区,什么问题他帮不了]
推荐原则:
- 不超过3个候选,选择困难比没选择更糟
- 已有Skill优先展示(即插即用,零成本)
- 候选之间要有差异性,不要推荐3个类似的人
- 必须说清楚局限——没有万能的思维框架
- 推荐要具体到「这个人的哪个思维模型」匹配需求,而不只是泛泛说「他很厉害」
Step 3: 用户选择
- 选了已有Skill → 直接激活该Skill,任务完成
- 选了新蒸馏候选 → 进入Phase 0A确认细节 → Phase 0.5开始蒸馏
- 都不满意 → 回到Step 1继续探索,或用户自己提出新人选
Phase 0.5: 创建Skill目录
收到确认后立即执行,在调研之前完成:
.claude/skills/[person-name]-perspective/
├── SKILL.md # 最终产物
└── references/
├── research/ # 每个Agent的调研结果(必存)
│ ├── 01-writings.md # 著作与系统思考
│ ├── 02-conversations.md # 长对话与即兴思考
│ ├── 03-expression-dna.md # 碎片表达与风格DNA
│ ├── 04-external-views.md # 他者视角与批评
│ ├── 05-decisions.md # 决策记录与行动
│ └── 06-timeline.md # 人物时间线
└── sources/ # 下载的一手素材
├── books/
├── transcripts/
└── articles/
完成检查(自动执行):
- 目录已创建
- 如果是中国人物:信息源策略切换为B站原始视频/小宇宙播客/权威中文媒体优先(知乎和微信公众号始终排除,见信息源黑名单)
- 如果是更新模式:已读取现有SKILL.md,标注哪些信息需要刷新
关键规则:
- 每个subagent必须把调研结果写入对应的md文件。不存文件的调研等于没做。
- 所有调研文件必须存在skill目录内部(
references/research/),绝对不要存到07-调研与分析/或其他外部目录。Skill必须是自包含的——复制整个skill目录就能独立使用,不依赖任何外部文件。这是为开源分发设计的核心原则。
Phase 1: 多源信息采集(并行Agent Swarm)
启动6个并行subagent,每个负责不同信息维度。
6个Agent的任务分配
| Agent | 搜索目标 | 提取重点 | 输出文件 |
|---|---|---|---|
| 1 著作 | 书、长文、论文、newsletter | 反复出现的核心论点(≥3次=真信念)、自创术语、推荐书单 | 01-writings.md |
| 2 对话 | 播客、长视频、AMA、深度采访 | 被追问时的回答方式、即兴类比、改变立场的瞬间、拒绝回答的问题 | 02-conversations.md |
| 3 表达 | Twitter/X、微博、即刻、短文 | 高频用词句式、争议立场、幽默方式、公开辩论 | 03-expression-dna.md |
| 4 他者 | 他人分析、书评、批评、传记 | 外部观察到的模式、批评与争议、与同行对比 | 04-external-views.md |
| 5 决策 | 重大决策、转折点、争议行为 | 决策背景与逻辑、事后反思、言行一致/不一致案例 | 05-decisions.md |
| 6 时间线 | 出生/出道到现在的完整时间线 | 关键里程碑、思想转折点、最近12个月动态(防过时) | 06-timeline.md |
每个Agent的硬性要求
- 调研结果必须写入
references/research/0X-xxx.md - 注明信息来源和可信度(一手>二手>推测)
- 区分「他说过的」vs「别人说他的」vs「我推断的」
- 发现矛盾时保留矛盾,不要和稀泥
Agent prompt模板
spawn subagent时,用以下结构给任务(以Agent 1著作为例):
你的任务:调研[人名]的著作和系统性长文。
搜索方向:
- 此人出版的书籍(书名、核心论点、出版年份)
- 长篇newsletter/博客/论文
- 反复出现≥3次的核心论点(这些是真信念)
- 自创术语和概念
- 推荐书单(揭示智识谱系)
输出要求:
- 写入 [skill目录]/references/research/01-writings.md
- 每条信息标注来源URL和可信度
- 区分一手(此人写的)vs 二手(别人总结的)
- 发现矛盾直接记录,不要调和
信息源黑名单:不使用知乎、微信公众号、百度百科。
其他5个Agent按同样结构调整搜索方向和输出文件名即可。
工具辅助(如可用)
- 书籍:Z-Library/LibGen搜索下载 → 存入
sources/books/ - 视频:yt-dlp下载字幕 → 存入
sources/transcripts/ - 播客:搜索transcript网站(podcastnotes.org等)
信息源优先级
| 来源类型 | 揭示什么 | 权重 |
|---|---|---|
| 本人著作 | 系统性思考 | 最高 |
| 长对话/访谈 | 即兴思维过程 | 最高 |
| 实际决策记录 | 真实行为 vs 声称 | 最高 |
| 社交媒体 | 表达风格、即时反应 | 中等 |
| 他人评价 | 外部视角、盲点 | 中等 |
| 二手转述 | 参考但需验证 | 低 |
信息源黑名单(永远排除)
- 知乎:洗稿严重、信息失真率高,不作为任何维度的来源
- 微信公众号:封闭生态、无法验证、大量二手转述,不作为来源
- 百度百科/百度知道:信息陈旧且不可靠
中文渠道只接受权威媒体:36氪、极客公园、晚点LatePost、财新、第一财经、虎嗅、少数派、机器之心等。人物访谈类可用播客平台(小宇宙、喜马拉雅原始音频)和B站原始视频(非搬运号)。
Agent超时与失败处理
- 单个Agent超时(搜索5分钟无有价值结果):不等待,继续推进。在Phase 2中标注「信息不足」,在诚实边界中说明
- 信息源匮乏(<10条可用来源):Phase 0.5就提醒用户,降低期望(心智模型减至2-3个),增加诚实边界篇幅
- Agent结果冲突:保留矛盾——矛盾本身是有价值的信号。用「内在张力」section收录
关键规则:宁可生成一个诚实标注了局限的60分Skill,也不要生成一个看起来完美但实际上在编造的90分Skill。
Phase 1.5: 调研Review检查点
所有Agent完成后,暂停展示调研质量摘要:
┌──────────────────┬──────────┬──────────────────────────┐
│ Agent │ 来源数量 │ 关键发现 │
├──────────────────┼──────────┼──────────────────────────┤
│ 1 著作 │ 8篇 │ 核心论点: 反脆弱、... │
│ 2 对话 │ 5段 │ 立场变化: 2020年后... │
│ 3 表达 │ 120条 │ 高频词: "skin in the..." │
│ 4 他者 │ 6篇 │ 主要批评: ... │
│ 5 决策 │ 4个 │ 关键决策: ... │
│ 6 时间线 │ 完整 │ 最新: 2026年3月... │
├──────────────────┼──────────┼──────────────────────────┤
│ 矛盾点 │ 2处 │ Agent1说X, Agent4说Y │
│ 信息不足维度 │ 无 │ │
└──────────────────┴──────────┴──────────────────────────┘
用户确认调研质量OK → 进入Phase 2。 用户觉得某维度不够 → 补充调研后再继续。
这个检查点的意义:调研质量决定了最终Skill的上限。垃圾进垃圾出,在这里拦截比在Phase 4返工成本低得多。
Phase 2: 框架提炼(Synthesis)
6个Agent的素材汇总后,执行结构化提炼。先读取 references/extraction-framework.md 获取心智模型的三重验证方法论(跨域复现、生成力、自创术语),确保提炼质量。
2.1 心智模型提取(3-7个)
操作步骤:
- 扫描:逐个读取
01-writings.md到05-decisions.md,列出所有候选论点(此人反复表达的观点、自创术语、核心主张)。通常会得到15-30个候选 - 三重验证筛选:对每个候选执行(详见
references/extraction-framework.md):- 跨域复现:在≥2个不同领域/话题中出现?
- 生成力:能推断此人对新问题的立场?
- 排他性:不是所有聪明人都这样想?
- 三重通过 → 心智模型;仅1-2重 → 降级为决策启发式;0重 → 丢弃
- 排序取舍:按排他性强度排序(越独特越靠前),取top 3-7个。宁少勿多——3个深刻的模型远好于10个浅薄的原则
- 记录格式:每个模型记录——名称、一句话描述、来源证据(≥2个场景)、应用方式、局限性
2.2 决策启发式提取(5-10条)
= 此人做判断时的快速规则。可表述为「如果X,则Y」,有具体案例支撑。
2.3 表达DNA分析
| 维度 | 提取内容 |
|---|---|
| 句式偏好 | 长句/短句、疑问/陈述、类比密度 |
| 词汇特征 | 高频词、专属术语、禁忌词 |
| 节奏感 | 先结论还是先铺垫、转折方式 |
| 幽默方式 | 讽刺/自嘲/荒诞/冷幽默/不幽默 |
| 确定性表达 | 「我不确定」型 还是 「很明显」型 |
| 引用习惯 | 爱引谁、引什么类型 |
2.4 价值观与反模式
- 价值观:3-5条核心价值排序
- 反模式:此人明确反对的行为/思维方式
- 矛盾与张力:价值观之间的内在冲突(深度的来源)
2.5 智识谱系
此人受谁影响 → 影响了谁 → 在思想地图上的位置
2.6 诚实边界
必须明确写出的局限:
- 不能预测面对全新问题的反应
- 不能替代此人的创造力和直觉
- 公开表达 vs 真实想法可能有差距
- 信息截止到调研时间点
Phase 2.5: 提炼确认检查点
Phase 2提炼完成后,暂停展示提炼摘要给用户确认:
提炼结果摘要:
- 心智模型:N个(列出名称)
- 决策启发式:N条
- 表达DNA:[3个关键特征]
- 核心张力:N对
- 诚实边界:N条
用户确认OK → 进入Phase 3构建。 用户觉得某个模型不对或缺少 → 回到Phase 2调整后再继续。
这个检查点的意义:提炼是主观判断最重的环节,确认后再构建,避免写完400行SKILL.md才发现方向不对。
Phase 3: Skill构建
将Phase 2提炼结果组装为可运行的SKILL.md。
Step 1: 读取模板
读取 references/skill-template.md 获取标准结构。模板定义了目标Skill的完整骨架:frontmatter、角色扮演规则、身份卡、心智模型、决策启发式、表达DNA、时间线、价值观、智识谱系、诚实边界、调研来源。
Step 2: 填充内容
按模板结构,将Phase 2的提炼结果逐section填入:
| 模板Section | 填充来源 |
|---|---|
| frontmatter description | 来源数量+模型数量+触发词 |
| 角色扮演规则 | 直接使用模板默认规则,不需要改 |
| 身份卡 | 时间线(06) + 著作(01) → 用此人语气写50字自我介绍 |
| 心智模型 | Phase 2.1 提取结果,每个含名称/证据/应用/局限 |
| 决策启发式 | Phase 2.2 提取结果,每条含场景+案例 |
| 表达DNA | Phase 2.3 分析结果 → 转为角色扮演时的风格规则 |
| 时间线 | Agent 6 调研结果,精简为关键节点表格 |
| 价值观与反模式 | Phase 2.4 结果 |
| 智识谱系 | Phase 2.5 结果 |
| 诚实边界 | Phase 2.6 结果 + 调研时间 |
| 调研来源 | 6个Agent的引用汇总,分一手/二手 |
Step 3: 质量自检
构建完成后,读取 references/extraction-framework.md 末尾的「质量自检清单」,逐项检查。不通过的项标注出来,回到对应Phase修复。
Step 4: 输出
将完成的SKILL.md写入 .claude/skills/[person-name]-perspective/SKILL.md。
Phase 4: 质量验证
生成Skill后,用子agent执行3项测试(独立于主agent,避免自评偏差):
4.1 已知测试(Sanity Check)
选3个此人公开表态过的问题,spawn子agent带着新Skill回答,对比实际立场。
- 方向一致 → 模型有效
- 偏离 → 回溯调整心智模型权重
4.2 边缘测试(Edge Case)
选1个此人没公开讨论过但相关的问题,用Skill推断。
- 期望结果:「基于模型X和Y的推断,可能...但不确定」
- 不应该斩钉截铁
4.3 风格测试(Voice Check)
用Skill写一段100字分析,判断:
- 有此人的表达特征?
- 不是通用AI味鸡汤?
- 不是原话拼凑?
4.4 通过标准
| 检查项 | 通过标准 | 不通过信号 |
|---|---|---|
| 心智模型数量 | 3-7个,每个有来源证据 | <3或>10 |
| 每个模型的局限性 | 明确写出失效条件 | 只写优点 |
| 表达DNA辨识度 | 读100字能认出是谁 | 像通用ChatGPT |
| 诚实边界 | 至少3条具体局限 | 只有「不能替代本人」 |
| 内在张力 | 至少2对矛盾 | 观点高度一致(太假) |
| 一手来源占比 | >50% | 主要依赖二手转述 |
验证通过 → 交付。不通过 → 标注薄弱环节,回到Phase 2迭代。 迭代上限:Phase 2→4最多循环2次。如果2轮后仍有不通过项,在诚实边界中标注薄弱维度,交付当前最优版本而非无限打磨。
展示验证结果给用户确认后才算完成。
更新已有Skill
当用户说「更新XX的skill」「XX最近有新动态」时:
- 读取现有SKILL.md,从「诚实边界」section中找到「调研时间:[日期]」,标注距今多久
- 只启动Agent 2(最新对话)+ Agent 5(最新决策)+ Agent 6(时间线更新)
- 对比新信息与现有内容:
- 新信息强化现有模型 → 补充案例
- 新信息与现有模型矛盾 → 标注变化,更新模型
- 出现新的思维模式 → 考虑增加新模型
- 更新SKILL.md中的「最新动态」section和调研时间
- 不重写整个Skill,只增量更新
品味守则(速查)
遇到判断困难时回看。具体量化标准见 Phase 4 通过标准表格。
| 原则 | 一句话 |
|---|---|
| 长文 > 金句 | 3000字essay比50条推文更揭示思维结构 |
| 争议 > 共识 | 最被争议的观点最能揭示独特性 |
| 变化 > 固定 | 改变立场的地方比一直坚持的更有信息量 |
绝不做的事
- 编造此人没说过的话
- 把通用道理包装成此人的「独特见解」
- 忽略负面评价和争议
- 在信息不足时强行生成
特殊场景
活人 vs 历史人物
- 活人:注意时效性,标注截止日期,建议定期更新
- 历史人物:材料更稳定但可能有传记偏差,多源交叉验证
主题Skill vs 人物Skill
输入不是人名而是主题(如「价值投资」「产品克制」「反脆弱决策」)时,各Phase变体:
| Phase | 人物Skill | 主题Skill变体 |
|---|---|---|
| 0A | 确认人名+聚焦方向 | 确认主题边界+目标受众(「价值投资」是格雷厄姆式还是全流派?) |
| 0.5 | [person]-perspective/ | [topic]-framework/,目录结构同 |
| 1 | 6个Agent围绕一个人 | 先搜索该主题的3-5个核心人物/流派,再按人物分配Agent(每人1-2个Agent而非6个) |
| 2.1 | 提取一个人的心智模型 | 提取领域共识框架(所有流派都认同的)+ 各家分歧(A说X,B说Y) |
| 2.3 | 模拟一个人的表达 | 不模拟特定人物语气,用中性但专业的表达 |
| 2.4 | 一个人的内在矛盾 | 流派间的根本分歧(如价值投资 vs 成长投资的哲学差异) |
| 3 | 用 skill-template.md | 调整模板:去掉角色扮演规则和身份卡,改为「框架概览」+「流派对比」 |
| 4 | 对比此人已知立场 | 对比领域内公认的经典案例 |
中国人物 vs 西方人物
- 中国人物:B站原始视频/演讲、小宇宙播客、权威媒体采访(36氪/晚点/财新/极客公园)、本人著作/微博。知乎和微信公众号永远排除
- 西方人物:Twitter、YouTube、Podcast、Amazon书评
冷门人物(公开信息极少)
当Phase 0.5评估后发现可用来源<10条时:
- 在Phase 0.5就告知用户「这个人的公开信息很少,生成的Skill质量会受限」
- 心智模型减至2-3个,每个都标注「基于有限信息推测」
- 诚实边界section加大篇幅,明确列出「哪些维度信息不足」
- 如果用户能提供一手素材(书籍、内部录音、私信),优先使用
蒸馏用户自己
当用户说「蒸馏我自己」「帮我做一个我的skill」时:
- 女娲无法从公开渠道搜到用户的思维框架,需要用户提供素材
- 引导用户提供:个人文章/博客、录制过的视频/播客、写过的决策备忘录、自我描述
- Phase 1的6个Agent改为分析用户提供的素材,而非网络搜索
- 特别注意「自我认知偏差」——用户可能高估某些特质、忽略盲点,可以追问身边人的评价
最后
女娲造的不是人,是一面镜子。
一个好的人物Skill,让你用另一个人的眼睛看自己的问题。不是为了模仿他们,而是为了拓展你自己的思维边界。
forumユーザーレビュー (0)
レビューを書く
レビューなし
統計データ
ユーザー評価
この Skill を評価