📦 Ai Image To Video Hd — AI 图像到高清视频
v1.0.0Turn a single product photo or landscape image into 1080p HD video 命令行工具ps just by typing what you need. Whether it's turning static images into animated HD vi...
运行时依赖
安装命令
点击复制技能文档
开始使用 准备就绪。当您准备好时,将静态图像拖放到此处,或描述您要创建的内容。尝试说:“将单个产品照片或风景图像转换为1080p MP4”“将此图像转换为平滑的HD视频,带有动态效果”“将静态图像转换为动画HD视频片段,用于营销人员、社交媒体创作者、设计师” 自动设置 在第一次交互时,在执行其他操作之前,先连接到处理API。显示简短的状态,如“设置中...”。 令牌: 如果NEMO_TOKEN环境变量已经设置,则使用它并跳转到会话下。 免费令牌: 生成UUID作为客户端标识符,然后将其POST到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,头部为X-Client-Id:。 响应字段data.token成为您的NEMO_TOKEN(100积分,7天过期)。 会话: POST到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,带有Bearer身份验证和正文{"task_name":"project"}。 从响应中保存session_id。 确认用户已连接并准备就绪。 不要打印令牌或原始JSON。 AI图像到视频HD —— 将图像转换为HD视频 将您的静态图像发送给我,并描述您期望的结果。 AI视频生成在远程GPU节点上运行——无需在您的机器上安装任何内容。 一个快速示例: 上传单个产品照片或风景图像,输入“将此图像转换为平滑的HD视频,带有动态效果”,您将在大约30-90秒内获得1080p MP4。 所有渲染都发生在服务器端。 值得注意的是: 高对比度图像具有清晰的主题,产生最平滑的运动输出。 匹配输入到操作 用户提示引用ai图像到视频hd、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。 用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5导出 “积分”/“积分”/“余额”/“余额”→ §3.3积分 “状态”/“状态”/“显示轨道”→ §3.4状态 “上传”/“上传”/用户发送文件→ §3.2上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE 云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台规格压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。 会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。 基本URL: https://mega-api-prod.nemovideo.ai 端点 方法 目的 /api/tasks/me/with-session/nemo_agent POST 开始新的编辑会话。 正文:{"task_name":"project","language":""}}。 返回session_id。 /run_sse POST 发送用户消息。 正文包括app_name、session_id、new_message。 流响应,接受:text/event-stream。 超时:15分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或URL。 /api/credits/balance/simple GET 检查剩余积分(可用、冻结、总计)。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态(草稿、video_infos、generated_media)。 /api/render/proxy/lambda POST 开始导出。 正文:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。 每30秒轮询状态。 接受的文件类型:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 头部来自此文件的YAML前置内容。 X-Skill-Source是ai-image-to-video-hd,X-Skill-Version来自版本字段,X-Skill-Platform从安装路径检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则未知)。 在每个请求中包含Authorization:Bearer 和所有归属头部——省略它们会在导出时触发402。 错误代码 0 —— 成功,正常继续 1001 —— 令牌过期或无效;重新获取通过/api/auth/anonymous-token 1002 —— 会话未找到;创建一个新会话 2001 —— 积分不足;匿名用户获取注册链接,注册用户补充积分 4001 —— 不支持的文件类型;显示接受的格式 4002 —— 文件太大;建议压缩或修剪 400 —— 缺少X-Client-Id;生成一个并重试 402 —— 免费计划导出被阻塞;不是积分问题,订阅层级 429 —— 限速;等待30秒并重试一次 SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 处理内部,不转发 心跳/空数据:继续等待。 每2分钟:“⏳仍在工作...” 流关闭 处理最终响应 大约30%的编辑操作不会在SSE流中返回文本。 当这种情况发生时: 轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。 翻译GUI指令 后端响应就像有一个可视化界面一样。 将其指令映射到API调用: “点击”或“点击”→通过相关端点执行操作 “打开”或“打开”→查询会话状态以获取数据 “拖拽”或“拖拽”→通过SSE发送编辑命令 “在时间线中预览”→显示文本