Keynote Video — 关键笔记视频

v2.0.0

PPT/演示文稿 → 播报视频。交互式内容评估 + LLM 讲稿生成 + 风格化口语重写 + 方案确认后自动合成。v2.0 架构：LLM 管内容，脚本管技术。支持 6 种风格：新闻播报/技术汇报/技术培训/故事讲述/商业演讲/轻松闲聊。

0· 0·0 当前·0 累计

by @vincentlau2046-sudo

开发工具代码生成 AI模型访问视频处理

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install keynote-video

镜像加速npx clawhub@latest install keynote-video --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

PPT 到视频（Keynote）v2.0 将演示文稿 + 背景材料 → 风格化播报视频核心流程：输入评估 → 内容理解 → 风格确定 → 讲稿生成 → 方案确认 → 技术合成 → 质量验证 (LLM) Phase 0 Phase 1 Phase 1 Phase 1 Phase 2 Phase 3 Phase 4 执行纪律（最高优先级） PHASE 分隔 — Phase 0-2 由 LLM 驱动（认知决策），Phase 3-4 由脚本驱动（技术合成） BLOCKING 步骤 — Phase 0（输入不足时）和 Phase 2（方案确认）必须等待用户响应禁止跳过确认 — 未经 Phase 2 用户确认，不得调用 generate.js 脚本做技术，LLM 做内容脚本不判断风格、不改写讲稿、不做内容决策串行执行 — Phase 必须按顺序执行，不得跳跃讲稿必须是纯文本 — 不含 markdown 标记，直接喂给 edge-tts

Phase 0：输入评估 GATE：用户提供了输入目录或文件 0.1 扫描输入扫描所有相关文件 find -type f $ -name ".pptx" -o -name ".ppt" -o -name ".pdf" -o -name ".md" -o -name ".txt" -o -name ".docx" $ 2>/dev/null | sort 统计 ls -la 0.2 完整性评分材料必需权重评分规则 PPT 文件必需 - 无则直接报错退出讲稿 (notes/.md) 可选 40% 按 PPT 页数比例背景材料可选 30% 存在即满分方案说明可选 30% 存在即满分 0.3 交互策略 ≥80分 → 自动进入 Phase 1 50-79分 → 提示用户： "当前输入评分 {score}/100，讲稿覆盖 {n}/{total} 页。建议补充：{缺少项} [1] 直接继续（LLM 将基于现有材料生成） [2] 我稍后补充" → 确认后进入 Phase 1 <50分 → BLOCKING，展示补充清单，等待用户 0.4 创建项目目录在 project/ 目录下创建独立项目文件夹，将用户输入文件拷贝到项目目录中，确保在"笼子"里操作：项目名：日期 + 简短描述 PROJECT_NAME="ppt-$(date +%Y%m%d)-" PROJECT_DIR="/project/${PROJECT_NAME}" mkdir -p "${PROJECT_DIR}/scripts_rewritten/" mkdir -p "${PROJECT_DIR}/input/" 拷贝用户输入文件到项目目录（保护原始文件） cp /.pptx "${PROJECT_DIR}/input/" 2>/dev/null cp /.ppt "${PROJECT_DIR}/input/" 2>/dev/null cp /.pdf "${PROJECT_DIR}/input/" 2>/dev/null 如果有 notes 或背景材料，也拷贝 find -name ".md" -o -name ".txt" | while read f; do cp "$f" "${PROJECT_DIR}/input/" done 规则：所有操作在项目目录内进行原始文件不被修改或删除临时文件（截图、音频、视频片段）也放在项目目录的 .temp/ 子目录下项目完成后，用户可选择保留或删除项目目录

Phase 1：内容理解 & 讲稿生成 GATE：输入评估通过，项目目录已创建 1.1 PPT 内容提取 python3 /scripts/extract_ppt_text.py "/input/" > "/ppt_text.md" 1.2 风格确定 LLM 分析 PPT 内容后，向用户推荐风格（BLOCKING）：根据内容分析，推荐以下风格： [1] 技术培训 (tech_training) — 适合教程/概念讲解 [2] 故事讲述 (story) — 适合案例/场景代入请确认或自选。 6 种风格速查： ID 名称适用音色语速 news 新闻播报情报/资讯 XiaoxiaoNeural +30% tech_report 技术汇报方案/架构 YunxiNeural +20% tech_training 技术培训教程/入门 YunxiNeural +15% story 故事讲述案例/产品 YunxiNeural +10% business 商业演讲 BP/路演 YunjianNeural +25% casual 轻松闲聊团队分享 XiaoyiNeural +20% 1.3 讲稿生成 LLM 读取： ppt_text.md（PPT 文字）已有的 notes/.md（如果有）背景材料（如果有）为每页生成演讲稿，遵循通用规则 + 风格特定规则：通用规则（所有风格）：纯文本输出，不含 markdown（*、#、|、` 等）用标点控制节奏：逗号=短停，句号=正常停，破折号=强调每 3-5 句换句号，给听众喘息先重点后事实，每页开头一句话概括核心特殊字符：数字转中文读法，缩写分开读，表格转叙述每页标注预计时长（目标 10-30 秒）风格特定规则（详见 DESIGN.md §1.3）：每种风格有独立的句式、开场、过渡、结尾、语气规范。生成讲稿时必须严格遵守当前风格的写作规范。 1.4 保存讲稿每页保存为独立纯文本文件： /scripts_rewritten/ ├── 01_xxx.txt ├── 02_xxx.txt ├── ... └── 19_xxx.txt 文件内容格式： {纯文本讲稿内容，直接可喂 TTS} 1.5 生成方案总览生成 /video_design_spec.md（用于 Phase 2 确认）： # {项目名} - 视频生成方案

基础信息

| 项目 | 值 | | PPT 总页数 | {n} | | 讲稿覆盖 | {n}/{n} (100%) | | 预计总时长 | {t} 秒 |

全局风格

| 风格 | {style_name} | | 主音色 | {voice} | | 语速 | {rate} |

逐页预览

| 页码 | 标题 | 内容类型 | 时长 | 讲稿预览 | | 1 | ... | ... | ...s | "前25字..." | ... 同时生成脚本可读的 JSON： # LLM 手动创建或生成 /video_design_spec.json JSON 结构： { "global": { "style": "tech_training", "styleName": "技术培训", "defaultVoice": "zh-CN-YunxiNeural", "rate": "+15%" }, "pages": [ { "num": 1, "title": "封面", "contentType": "封面", "pageStyle": "story", "voice": "zh-CN-XiaoxiaoNeural", "rate": "+15%", "duration": 15 } ] }

Phase 2：方案确认 GATE：Phase 1 完成，方案总览已生成 BLOCKING — 必须等待用户确认向用户展示 video_design_spec.md，等待响应：请确认：

确认生成 → 进入 Phase 3
修改第X页 → 重新生成该页 → 再次确认
调整风格/音色 → 更新设置 → 重新确认

用户确认后，进入 Phase 3。

Phase 3：技术合成 GATE：Phase 2 用户已确认调用 generate.js，纯自动化执行： node /scripts/generate.js \ --slides "/input/" \ --scripts-dir "/scripts_rewritten/" \ --output "" \ --spec "/video_design_spec.json" \ --project-dir "" \ --keep-temp 脚本职责： PPT 截图（LibreOffice → pdftoppm

数据来源：ClawHub ↗ · 中文优化：龙虾技能库