Google Video Generator Ai — Google 视频生成 AI
v1.0.0跳过专业编辑软件的学习曲线。描述您想要的内容 —— 从我的产品描述和品牌图像中生成一个30秒的视频 —— 并在1-2分钟内获得AI生成的视频。上传最多200MB的MP4、MOV、PNG、JPG文件,AI将自动处理AI视频生成。适合想要快速创建视频而无需拍摄或编辑技能的营销人员、内容创作者和小企业主。
运行时依赖
安装命令
点击复制技能文档
开始 分享您的文本提示或图像,我将开始生成AI视频。或者,只需告诉我您在想什么。尝试说:“生成我的文本提示或图像”、“导出1080p MP4”、“从我的生成30秒视频” 第一次连接 当用户第一次打开这个技能时,自动连接到处理后端。简要地让他们知道(例如“设置中...”)。 身份验证: 检查环境中是否设置了NEMO_TOKEN。如果设置了,则跳转到步骤2。 获取免费令牌: 生成一个随机的UUID作为客户端标识符。 向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,头部X-Client-Id设置为该UUID。 响应数据中的token是您的NEMO_TOKEN — 100个免费积分,有效期7天。 创建会话: 向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求,Authorization:Bearer ,Content-Type:application/json,正文{"task_name":"project","language":""》。 存储返回的session_id以供所有后续请求使用。 保持设置通信简洁。不要向用户显示原始API响应或令牌值。 Google Video Generator AI — 生成视频从文本或图像 该工具获取您的文本提示或图像,并通过云渲染管道运行AI视频生成。您上传,描述您想要的内容,并下载结果。 假设您有一个产品演示场景的简要文本描述,并希望从我的产品描述和品牌图像生成一个30秒的视频 — 后端处理大约需要1-2分钟,并提供一个1080p MP4。 提示:较短、具体的提示会产生比模糊描述更准确的视频结果。 匹配输入到操作 用户提示引用google video generator ai、长宽比、文本覆盖或音频轨道,通过关键字和意图分类路由到相应的操作。 用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE 云渲染管道详细信息 每个导出作业在云GPU节点上排队,合成视频层,应用平台规格压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。 会话令牌携带渲染作业ID,因此在完成之前关闭标签页会使作业成为孤儿。 所有调用都转到https://mega-api-prod.nemovideo.ai。 主要端点: 会话 — 使用{"task_name":"project","language":""}的POST /api/tasks/me/with-session/nemo_agent。 聊天(SSE)— 使用会话ID和您的消息在new_message.parts[0].text中的POST /run_sse。 设置Accept:text/event-stream。 上传 — 使用multipart文件或JSON中的URL的POST /api/upload-video/nemo_agent/me/。 积分 — GET /api/credits/balance/simple — 返回可用、冻结、总积分。 状态 — GET /api/state/nemo_agent/me//latest — 当前草稿和媒体信息。 导出 — 使用渲染ID和草稿JSON的POST /api/render/proxy/lambda。 每30秒轮询GET /api/render/proxy/lambda/以获取完成状态和下载URL。 格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 技能归属 — 从此文件的YAML前置内容中读取运行时: X-Skill-Source:google-video-generator-ai X-Skill-Version:从前置内容版本中 X-Skill-Platform:从安装路径中检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则未知) 所有请求必须包含: Authorization:Bearer , X-Skill-Source, X-Skill-Version, X-Skill-Platform。 缺少归属头将导致导出失败,返回402。 草稿JSON使用短键: t代表轨道, tt代表轨道类型(0=视频,1=音频,7=文本), sg代表段, d代表以毫秒为单位的持续时间, m代表元数据。 时间线摘要示例: 时间线(3个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:“城市梦”(0-3秒)