Back to feed

NyxTides/ppt-image-first

NyxTides/ppt-image-first
380
+264/day
41
Python

PPT image-first skill for Codex/Claude Code/Opencode CLI

From the README

ppt-image-first

中文 | English

一个 conversation-first、image-first 的 PPT 工作流 skill,用来把一个模糊的 PPT 需求,逐步推进成:内容基底、风格预览、定稿规划,以及后续可执行的生成流程。

ppt-image-first 不是那种一上来就让用户填一堆参数,或者直接套模板拼页面的 PPT skill。它更像一个分阶段推进的提案式工作流:先理解需求、补内容基底、出真实预览、允许反复推风格,最后再进入锁定与生成。

说明:输出方式是 image-first。 这套 workflow 默认使用 GPT Image 2 生成整页视觉图,再把这些页面图放入 PPTX 容器中交付;它不是直接用 PowerPoint 对象逐个绘制文字框、形状和图表的“完全可编辑 PPT”生成器。因此,成品更接近高完成度视觉稿式演示页:适合展示、汇报和继续做图像级 retouch,但页面内的文字、图形、装饰元素通常不能像原生 PPT 元素一样逐项编辑。

示例速览

1. 工作流总览示意图

2. 答辩 / 汇报类首页示例

3. 校园 / 红色主题类成品示例

4. 技术研究类正文页示例

示例 PPT

项目内已附一份直接用这套 workflow 做出来的介绍型演示稿,可直接下载查看:

这份文件的主题就是 ppt-image-first 本身,适合用来快速感受这套 skill 产出的页面风格、叙事组织和整体完成度。

这个 skill 是干什么的

它适合处理这类请求:

  • “帮我做一个 PPT”
  • “把这份报告整理成演示稿”
  • “帮我做答辩 PPT”
  • “做一个产品介绍 deck”
  • “先给我几套视觉方向看看,再决定风格”
  • “我现在只有主题和一些散材料,你先帮我把它整理成能做 PPT 的东西”

它的核心不是“快速出一个模板”,而是走一套完整流程:

  1. 轻量 intake
  2. 输出 baseline judgment
  3. 进入 需求确认
  4. 生成风格前内容基底 / content_report.md
  5. 做风格边界对齐
  6. 产出多套风格方向预览
  7. 必要时继续风格 refinement
  8. 进入 风格确认
  9. 风格反演确认
  10. 写规划文件
  11. 进入 生成前确认
  12. 选择生成分支
  13. 进入 review & retouch loop
  14. 最终导出

为什么要做这个 skill

很多 PPT 工作流会在两个方向上出问题:

  • 太模板化:看起来工整,但内容和主题贴合度不够,容易泛
  • 太浅:视觉上像 PPT,但内容没有形成真正能支撑汇报的叙事和深度

ppt-image-first 的目标就是同时避免这两类问题。

它的基本思路是:

  • 前台对话尽量轻,不把用户拖进长问卷
  • 如果材料偏薄,先补内容基底,再谈风格
  • 风格确认默认依赖真实预览图,不是文字描述
  • 最终页面视觉默认走 image-first 路径,不靠后期大量补 overlay 修修补补

核心特点

1. Conversation-first

用户被当成甲方,agent 被当成提出方向、生成方案、推进流程的设计侧。

这意味着:

  • 首轮问题轻量
  • 不做长表单式提问
  • 用户主要对判断、方向、预览和 refinement 进行反馈
  • agent 内部可以有复杂逻辑,但前台交互尽量自然

2. Image-first

这里的 preview 默认指 真实生成的图像预览,而不是:

  • 文字 mockup
  • ASCII 草图
  • 占位壳子
  • 只描述风格、不真正出图

最终生成也遵循同样逻辑:优先让 GPT Image 2 直接生成整页页面视觉,再封装进 PPTX;这能保持视觉完整度和风格一致性,但不承诺每个页面元素都是 PowerPoint 原生可编辑对象。

3. 先补内容,再做风格

需求确认 之后,如果用户没有给出完整的报告式材料,就先生成一个 content_report.md 作为上游内容基底。

这样后面的:

  • 首页预览
  • 目录页预览
  • 正文页预览
  • design_spec.md
  • slide_blueprint.md
  • spec_lock.md

都不是从空主题硬编,而是有真实内容来源。

4. 先看预览,再确认风格

它不会让用户直接在文字里选最终风格,而是先产出:

  • 首页
  • 目录页
  • 正文页

这三类预览,让用户看过再决定。

5. Review 不是可选项

第一版完整结果出来后,不默认视为结束,而是进入专门的 review-and-retouch 流程。

工作流总览

Stage 1 — Intake and baseline judgment

只收集最必要的信息:

  • 用途
  • 受众
  • 粗略页数 / 时长
  • 手头材料
  • 学校 / 公司 / 实验室 / 课题组 / 课程 / 品牌主体等真实身份锚点

然后输出一个简短 baseline judgment,并停在 需求确认

Stage 1.25 — 风格前内容研究与报告化基底

如果用户没有直接给出完整叙述内容,就先生成 content_report.md

这个阶段的作用是:

  • 给薄主题补出可讲的内容主线
  • 把散材料整理成可展开叙事
  • 让预览页不再是空壳
  • 让后续规划文件有真实来源

Stage 1.5 — 风格边界对齐

只问 3 个短问题:

  • 整体偏亮 / 偏暗 / 中间态
  • 常规专业路线 / 明显风格化路线
  • 这次先看几套方向

Stage 2 — 风格提案与预览

生成多套风格方向,并给出真实预览图,覆盖:

  • 首页
  • 目录页
  • 正文页

Stage 2.5 — 风格 refinement

如果用户对某套方向基本满意但想继续调整,就从这一套继续往下推,而不是强迫立即定稿。

Stage 2.75 — 风格反演确认

把用户最终选中的预览图当成“证据”,反推出用户真正喜欢的是哪些稳定特征,并区分:

  • 明确应延续的
  • 效果好但要确认是否整套延续的
  • 只在当前图里偶然成立、不建议锁死的

Stage 3 — 规划文件

按顺序生成:

  1. design_spec.md
  2. slide_blueprint.md
  3. spec_lock.md

然后进入 生成前确认

Stage 4 — 生