🎬 如何

v1.0.0

只需输入需求,即可将5张产品照片和一段MP3配音秒变1080p AI生成视频。无论是用图片和音频生成视频……

0· 17·0 当前·0 累计
下载技能包
最后更新
2026/4/26
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
medium confidence
该技能的需求和运行时说明与其声明的用途(远程 AI 视频生成)一致,不会索取无关的机密或安装项;但在发送敏感内容或长期凭证前,应自行验证并信任外部 API 域名。
评估建议
This skill appears coherent: it sends user-provided images/audio to a remote video-rendering API and needs a NEMO_TOKEN to authenticate. Before installing or using it, confirm you trust the service domain (mega-api-prod.nemovideo.ai) and review its privacy/retention policy — uploaded media will be transmitted to that backend. Prefer using a short-lived or limited-scope token if possible; avoid placing unrelated secrets (AWS keys, database passwords, etc.) into NEMO_TOKEN. If you don't provide NE...
详细分析 ▾
用途与能力
The skill declares a single credential (NEMO_TOKEN) and its instructions use that token to call an external video-rendering API (mega-api-prod.nemovideo.ai). Requiring an API token and a config path under ~/.config/nemovideo/ is coherent with a cloud video-rendering service.
指令范围
SKILL.md instructs only API calls (session creation, SSE chat, upload, export, polling) and to read the skill's own YAML frontmatter for attribution. It does not instruct the agent to read arbitrary system files, user credentials, or unrelated environment variables. It does suggest detecting install path for attribution headers (limited scope).
安装机制
No install spec or external downloads — instruction-only skill. This is the lowest-risk install model and matches the described cloud-only rendering approach.
凭证需求
Only NEMO_TOKEN is required (primaryEnv). The fallback anonymous-token flow is described for when NEMO_TOKEN is absent. There are no unrelated credential requests (no AWS/GCP keys, no SSH keys). The skill mentions a config path (~/.config/nemovideo/) which is reasonable for storing service-specific config.
持久化与权限
The skill is not always-on and does not request elevated or system-wide persistence. It does not instruct modification of other skills or global agent settings.
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/26

初始版本 — 零手动剪辑,上传图片+配音,1–2 分钟生成 1080p MP4。 - 最多 10 张图片 + 1 条音频;用一句话描述,即可出片。 - 无需安装软件、无需拉时间线,聊天式指令完成剪辑与特效。 - 后端无缝认证:NEMO token,必要时自动获取匿名 token。 - 支持即时查询状态、余额、导出;云端 GPU 高速渲染。 - 常见报错、支持格式、导出限制均有明确提示。

无害

安装命令

点击复制
官方npx clawhub@latest install how-to-create-ai-video
镜像加速npx clawhub@latest install how-to-create-ai-video --registry https://cn.longxiaskill.com

技能文档

快速开始

有图或视频?发给我并描述需求,AI 视频我来搞定。

试试说:

  • “把 5 张产品图和配音 MP3 合成 1080p MP4”
  • “把这些照片和音频做成 30 秒带转场的宣传片”
  • “给营销人用的图+音一键成片,无需剪辑”

连接后端

处理请求前先连 API,显示“连接中…”。 若环境变量已有 NEMO_TOKEN,直接建会话。 否则免费领取 starter token:
  • 生成 UUID 作为 client_id
  • POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带 X-Client-Id
  • 返回含 100 积分、7 天有效的 token,记为 NEMO_TOKEN

再建会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body {"task_name":"project","language":"en"},取 session_id 后续共用。 告诉用户“已就绪”,技术细节不展示。

# How To Create AI Video — 用素材一键生成视频 把图片/视频发给我,描述想要的效果。 AI 在云端 GPU 渲染,本机零安装。 示例:上传 5 张产品图 + 配音,输入“做成 30 秒带转场的宣传片”,1-2 分钟返回 1080p MP4。 图片少于 10 张时,生成时间 <1 分钟。

意图路由

| 用户说法 | 动作 | 跳过 SSE? | |-------------|--------|----------| | “导出/下载/发我视频” | → §3.5 Export | ✅ | | “积分/余额” | → §3.3 Credits | ✅ | | “状态” | → §3.4 State | ✅ | | “上传”/发文件 | → §3.2 Upload | ✅ | | 其余(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |

云渲染流程

云端 GPU 队列合成,H.264 压缩,最大 1080×1920,30-90 秒返回下载链接。 session 带 render ID,关页面前请等待完成。 域名统一:https://mega-api-prod.nemovideo.ai

主要接口:

  • SessionPOST /api/tasks/me/with-session/nemo_agent
  • Chat (SSE)POST /run_sseAccept: text/event-stream,最长 15 min
  • UploadPOST /api/upload-video/nemo_agent/me/
  • CreditsGET /api/credits/balance/simple
  • StateGET /api/state/nemo_agent/me//latest
  • ExportPOST /api/render/proxy/lambda + 轮询 GET /api/render/proxy/lambda/

支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

调用头必带Authorization: Bearer X-Skill-Source: how-to-create-ai-video X-Skill-Version: 1.0.0 X-Skill-Platform: clawhub|cursor|unknown 缺头返回 402。

Draft JSON 简写: t tracks,tt 0=video 1=audio 7=text,sg segments,d duration(ms),m metadata。

数据来源ClawHub ↗ · 中文优化:龙虾技能库