NyxTides/ppt-image-first

380

+264/day

Python

PPT image-first skill for Codex/Claude Code/Opencode CLI

From the README

ppt-image-first

中文 | English

一个 conversation-first、image-first 的 PPT 工作流 skill，用来把一个模糊的 PPT 需求，逐步推进成：内容基底、风格预览、定稿规划，以及后续可执行的生成流程。

ppt-image-first 不是那种一上来就让用户填一堆参数，或者直接套模板拼页面的 PPT skill。它更像一个分阶段推进的提案式工作流：先理解需求、补内容基底、出真实预览、允许反复推风格，最后再进入锁定与生成。

说明：输出方式是 image-first。 这套 workflow 默认使用 GPT Image 2 生成整页视觉图，再把这些页面图放入 PPTX 容器中交付；它不是直接用 PowerPoint 对象逐个绘制文字框、形状和图表的“完全可编辑 PPT”生成器。因此，成品更接近高完成度视觉稿式演示页：适合展示、汇报和继续做图像级 retouch，但页面内的文字、图形、装饰元素通常不能像原生 PPT 元素一样逐项编辑。

示例速览

1. 工作流总览示意图

2. 答辩 / 汇报类首页示例

3. 校园 / 红色主题类成品示例

4. 技术研究类正文页示例

示例 PPT

项目内已附一份直接用这套 workflow 做出来的介绍型演示稿，可直接下载查看：

下载示例 PPT（ppt-image-first-demo-deck.pptx）

这份文件的主题就是 ppt-image-first 本身，适合用来快速感受这套 skill 产出的页面风格、叙事组织和整体完成度。

这个 skill 是干什么的

它适合处理这类请求：

“帮我做一个 PPT”
“把这份报告整理成演示稿”
“帮我做答辩 PPT”
“做一个产品介绍 deck”
“先给我几套视觉方向看看，再决定风格”
“我现在只有主题和一些散材料，你先帮我把它整理成能做 PPT 的东西”

它的核心不是“快速出一个模板”，而是走一套完整流程：

轻量 intake
输出 baseline judgment
进入 需求确认
生成风格前内容基底 / content_report.md
做风格边界对齐
产出多套风格方向预览
必要时继续风格 refinement
进入 风格确认
做 风格反演确认
写规划文件
进入 生成前确认
选择生成分支
进入 review & retouch loop
最终导出

为什么要做这个 skill

很多 PPT 工作流会在两个方向上出问题：

太模板化：看起来工整，但内容和主题贴合度不够，容易泛
太浅：视觉上像 PPT，但内容没有形成真正能支撑汇报的叙事和深度

ppt-image-first 的目标就是同时避免这两类问题。

它的基本思路是：

前台对话尽量轻，不把用户拖进长问卷
如果材料偏薄，先补内容基底，再谈风格
风格确认默认依赖真实预览图，不是文字描述
最终页面视觉默认走 image-first 路径，不靠后期大量补 overlay 修修补补

核心特点

1. Conversation-first

用户被当成甲方，agent 被当成提出方向、生成方案、推进流程的设计侧。

这意味着：

首轮问题轻量
不做长表单式提问
用户主要对判断、方向、预览和 refinement 进行反馈
agent 内部可以有复杂逻辑，但前台交互尽量自然

2. Image-first

这里的 preview 默认指 真实生成的图像预览，而不是：

文字 mockup
ASCII 草图
占位壳子
只描述风格、不真正出图

最终生成也遵循同样逻辑：优先让 GPT Image 2 直接生成整页页面视觉，再封装进 PPTX；这能保持视觉完整度和风格一致性，但不承诺每个页面元素都是 PowerPoint 原生可编辑对象。

3. 先补内容，再做风格

在 需求确认 之后，如果用户没有给出完整的报告式材料，就先生成一个 content_report.md 作为上游内容基底。

这样后面的：

首页预览
目录页预览
正文页预览
design_spec.md
slide_blueprint.md
spec_lock.md

都不是从空主题硬编，而是有真实内容来源。

4. 先看预览，再确认风格

它不会让用户直接在文字里选最终风格，而是先产出：

首页
目录页
正文页

这三类预览，让用户看过再决定。

5. Review 不是可选项

第一版完整结果出来后，不默认视为结束，而是进入专门的 review-and-retouch 流程。

工作流总览

Stage 1 — Intake and baseline judgment

只收集最必要的信息：

用途
受众
粗略页数 / 时长
手头材料
学校 / 公司 / 实验室 / 课题组 / 课程 / 品牌主体等真实身份锚点

然后输出一个简短 baseline judgment，并停在 需求确认。

Stage 1.25 — 风格前内容研究与报告化基底

如果用户没有直接给出完整叙述内容，就先生成 content_report.md。

这个阶段的作用是：

给薄主题补出可讲的内容主线
把散材料整理成可展开叙事
让预览页不再是空壳
让后续规划文件有真实来源

Stage 1.5 — 风格边界对齐

只问 3 个短问题：

整体偏亮 / 偏暗 / 中间态
常规专业路线 / 明显风格化路线
这次先看几套方向

Stage 2 — 风格提案与预览

生成多套风格方向，并给出真实预览图，覆盖：

首页
目录页
正文页

Stage 2.5 — 风格 refinement

如果用户对某套方向基本满意但想继续调整，就从这一套继续往下推，而不是强迫立即定稿。

Stage 2.75 — 风格反演确认

把用户最终选中的预览图当成“证据”，反推出用户真正喜欢的是哪些稳定特征，并区分：

明确应延续的
效果好但要确认是否整套延续的
只在当前图里偶然成立、不建议锁死的

Stage 3 — 规划文件

按顺序生成：

design_spec.md
slide_blueprint.md
spec_lock.md

然后进入 生成前确认。

Stage 4 — 生

View on GitHub