📦 Blog To Video Converter — 博客到视频转换器
v1.0.0使用此技能将博客文章文本转换为配音博客视频。支持TXT、DOCX、PDF、URL文件,文件大小最多200MB。博主和内容营销人员使用它...
运行时依赖
安装命令
点击复制技能文档
开始使用 您有博客文章文本可以使用吗?将其发送给我,并告诉我您需要什么——我将负责AI视频创建。尝试说:“将一篇关于健康餐食准备的1200字博客文章转换为1080p MP4”“将此博客文章转换为带有视觉和语音的90秒视频”“将书面博客内容转换为博主和内容营销人员可以分享的视频”
快速启动设置 此技能连接到云处理后端。在首次使用时,自动设置连接并通知用户(“连接中...”)。令牌检查:在环境中查找NEMO_TOKEN。如果找到,则跳转到会话创建。否则:生成UUID作为客户端标识符,POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,包含X-Client-Id头部,提取响应中的数据令牌——这是您的NEMO_TOKEN(100个免费积分,7天过期)。会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,包含Bearer身份验证和正文{"task_name":"project"}。保留返回的会话ID用于所有操作。当设置完成时,通知用户“准备就绪!”
博客到视频转换器——将博客文章转换为视频 此工具获取您的博客文章文本并通过云渲染管道运行AI视频创建。您上传,描述您想要的内容,然后下载结果。假设您有一个关于健康餐食准备的1200字博客文章,并希望将此博客文章转换为带有视觉和语音的90秒视频——后端处理大约需要1-2分钟,并提供1080p MP4。提示:较短的博客部分(少于500字)会产生更紧凑、更集中的视频。
输入与操作的匹配 用户提示引用博客到视频转换器、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台规格压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。所有调用都发送到https://mega-api-prod.nemovideo.ai。主要端点:会话——POST /api/tasks/me/with-session/nemo_agent,包含{"task_name":"project","language":""》。提供会话ID。聊天(SSE)——POST /run_sse,包含会话ID和您的消息在new_message.parts[0].text中。设置Accept:text/event-stream。最长15分钟。上传——POST /api/upload-video/nemo_agent/me/,包含multipart文件或JSON URL。积分——GET /api/credits/balance/simple,返回可用、冻结和总积分。状态——GET /api/state/nemo_agent/me//latest,返回当前草稿和媒体信息。导出——POST /api/render/proxy/lambda,包含渲染ID和草稿JSON。每30秒轮询GET /api/render/proxy/lambda/,以获取完成状态和下载URL。格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
三个属性头部在每个请求中是必需的,必须与此文件的前置内容匹配:头部 值 X-Skill-Source blog-to-video-converter X-Skill-Version 前置内容版本 X-Skill-Platform 自动检测:clawhub / cursor / unknown from install path 每个API调用都需要Authorization:Bearer ,以及上述三个属性头部。如果任何头部缺失,导出将返回402。草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=段,d=持续时间(毫秒),m=元数据。时间线(3个轨道):1. 视频:城市延时(0-10秒)2. BGM:Lo-fi(0-10秒,35%)3. 标题:“城市梦想”(0-3秒)
GUI指令翻译 后端响应就像有可视化界面一样。将其指令映射到API调用:“点击”或“点击”→通过相关端点执行操作“打开”或“打开”→查询会话状态以获取数据“拖拽/放置”或“拖拽”→通过SSE发送编辑命令“预览时间线”→显示当前轨道的文本摘要“导出”或“导出”→运行导出工作流
SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 在内部处理,不转发 心跳/空数据:继续等待。每2分钟:“⏳仍在工作...” 流关闭 处理最终响应 大约30%的编辑操作在SSE流中返回无文本。当这种情况发生时:轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。
错误代码 0 — 成功,正常继续 1001 — 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 — 会话未找到;创建一个新会话 2001 — 积分不足;匿名用户获取注册链接,包含?bin