NyxTides/ppt-image-first
NyxTides/ppt-image-firstPPT image-first skill for Codex/Claude Code/Opencode CLI
From the README
ppt-image-first
中文 | English
一个 conversation-first、image-first 的 PPT 工作流 skill,用来把一个模糊的 PPT 需求,逐步推进成:内容基底、风格预览、定稿规划,以及后续可执行的生成流程。
ppt-image-first 不是那种一上来就让用户填一堆参数,或者直接套模板拼页面的 PPT skill。它更像一个分阶段推进的提案式工作流:先理解需求、补内容基底、出真实预览、允许反复推风格,最后再进入锁定与生成。
说明:输出方式是 image-first。 这套 workflow 默认使用 GPT Image 2 生成整页视觉图,再把这些页面图放入 PPTX 容器中交付;它不是直接用 PowerPoint 对象逐个绘制文字框、形状和图表的“完全可编辑 PPT”生成器。因此,成品更接近高完成度视觉稿式演示页:适合展示、汇报和继续做图像级 retouch,但页面内的文字、图形、装饰元素通常不能像原生 PPT 元素一样逐项编辑。
示例速览
1. 工作流总览示意图
2. 答辩 / 汇报类首页示例
3. 校园 / 红色主题类成品示例
4. 技术研究类正文页示例
示例 PPT
项目内已附一份直接用这套 workflow 做出来的介绍型演示稿,可直接下载查看:
这份文件的主题就是 ppt-image-first 本身,适合用来快速感受这套 skill 产出的页面风格、叙事组织和整体完成度。
这个 skill 是干什么的
它适合处理这类请求:
- “帮我做一个 PPT”
- “把这份报告整理成演示稿”
- “帮我做答辩 PPT”
- “做一个产品介绍 deck”
- “先给我几套视觉方向看看,再决定风格”
- “我现在只有主题和一些散材料,你先帮我把它整理成能做 PPT 的东西”
它的核心不是“快速出一个模板”,而是走一套完整流程:
- 轻量 intake
- 输出 baseline judgment
- 进入 需求确认
- 生成风格前内容基底 /
content_report.md - 做风格边界对齐
- 产出多套风格方向预览
- 必要时继续风格 refinement
- 进入 风格确认
- 做
风格反演确认 - 写规划文件
- 进入 生成前确认
- 选择生成分支
- 进入 review & retouch loop
- 最终导出
为什么要做这个 skill
很多 PPT 工作流会在两个方向上出问题:
- 太模板化:看起来工整,但内容和主题贴合度不够,容易泛
- 太浅:视觉上像 PPT,但内容没有形成真正能支撑汇报的叙事和深度
ppt-image-first 的目标就是同时避免这两类问题。
它的基本思路是:
- 前台对话尽量轻,不把用户拖进长问卷
- 如果材料偏薄,先补内容基底,再谈风格
- 风格确认默认依赖真实预览图,不是文字描述
- 最终页面视觉默认走 image-first 路径,不靠后期大量补 overlay 修修补补
核心特点
1. Conversation-first
用户被当成甲方,agent 被当成提出方向、生成方案、推进流程的设计侧。
这意味着:
- 首轮问题轻量
- 不做长表单式提问
- 用户主要对判断、方向、预览和 refinement 进行反馈
- agent 内部可以有复杂逻辑,但前台交互尽量自然
2. Image-first
这里的 preview 默认指 真实生成的图像预览,而不是:
- 文字 mockup
- ASCII 草图
- 占位壳子
- 只描述风格、不真正出图
最终生成也遵循同样逻辑:优先让 GPT Image 2 直接生成整页页面视觉,再封装进 PPTX;这能保持视觉完整度和风格一致性,但不承诺每个页面元素都是 PowerPoint 原生可编辑对象。
3. 先补内容,再做风格
在 需求确认 之后,如果用户没有给出完整的报告式材料,就先生成一个 content_report.md 作为上游内容基底。
这样后面的:
- 首页预览
- 目录页预览
- 正文页预览
design_spec.mdslide_blueprint.mdspec_lock.md
都不是从空主题硬编,而是有真实内容来源。
4. 先看预览,再确认风格
它不会让用户直接在文字里选最终风格,而是先产出:
- 首页
- 目录页
- 正文页
这三类预览,让用户看过再决定。
5. Review 不是可选项
第一版完整结果出来后,不默认视为结束,而是进入专门的 review-and-retouch 流程。
工作流总览
Stage 1 — Intake and baseline judgment
只收集最必要的信息:
- 用途
- 受众
- 粗略页数 / 时长
- 手头材料
- 学校 / 公司 / 实验室 / 课题组 / 课程 / 品牌主体等真实身份锚点
然后输出一个简短 baseline judgment,并停在 需求确认。
Stage 1.25 — 风格前内容研究与报告化基底
如果用户没有直接给出完整叙述内容,就先生成 content_report.md。
这个阶段的作用是:
- 给薄主题补出可讲的内容主线
- 把散材料整理成可展开叙事
- 让预览页不再是空壳
- 让后续规划文件有真实来源
Stage 1.5 — 风格边界对齐
只问 3 个短问题:
- 整体偏亮 / 偏暗 / 中间态
- 常规专业路线 / 明显风格化路线
- 这次先看几套方向
Stage 2 — 风格提案与预览
生成多套风格方向,并给出真实预览图,覆盖:
- 首页
- 目录页
- 正文页
Stage 2.5 — 风格 refinement
如果用户对某套方向基本满意但想继续调整,就从这一套继续往下推,而不是强迫立即定稿。
Stage 2.75 — 风格反演确认
把用户最终选中的预览图当成“证据”,反推出用户真正喜欢的是哪些稳定特征,并区分:
- 明确应延续的
- 效果好但要确认是否整套延续的
- 只在当前图里偶然成立、不建议锁死的
Stage 3 — 规划文件
按顺序生成:
design_spec.mdslide_blueprint.mdspec_lock.md
然后进入 生成前确认。