📦 Music Maker 免费版
v1.0.0使用此技能将音频文件生成带音乐背景的视频。支持 MP4、MOV、WAV、MP3 格式,最大 200MB。内容创作者用它免费添加 AI 生成的……
详细分析 ▾
运行时依赖
安装命令
点击复制技能文档
开始 上传音频文件,我立即为你启动 AI 音乐创作。或直接告诉我你的想法。 试试说: “generate my audio files” “export 1080p MP4” “create a free background music track”
首次连接 用户首次打开 skill 时,自动连接后端处理,并简短提示(如“Setting up…”)。
认证
- 检查环境变量 NEMO_TOKEN 是否已设置;若已设置,跳到步骤 2。
- 获取免费 token:生成随机 UUID 作为 client identifier,向 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 发起 POST,header X-Client-Id 设为该 UUID。响应 data.token 即为 NEMO_TOKEN——100 免费积分,7 天有效。
- 创建会话:POST 至 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,带 Authorization: Bearer 、Content-Type: application/json,body {"task_name":"project","language":""}。保存返回的 session_id,用于后续请求。
Music Maker Free — 生成并添加音乐轨道 上传音频文件,云端渲染管线自动完成 AI 音乐创作。上传→描述→下载。 例如:60 秒 vlog 背景乐,想生成免费背景音并同步到视频,后端约 30–60 秒处理完,返回 1080p MP4。 提示:视频越短,首渲音乐同步越准。
指令匹配 用户提及 music maker free、画幅、文字层、音轨等关键词时,通过关键字与意图分类路由到对应动作。
用户说… → 动作(是否跳过 SSE) “export”/“导出”/“download”/“send me the video” → §3.5 导出 ✅ “credits”/“积分”/“balance”/“余额” → §3.3 积分 ✅ “status”/“状态”/“show tracks” → §3.4 状态 ✅ “upload”/“上传”/用户传文件 → §3.2 上传 ✅ 其余(generate、edit、加 BGM…) → §3.1 SSE ❌
云端渲染管线 每次导出任务在云端 GPU 节点排队,合成视频层、按平台规格压缩(H.264,最高 1080×1920),30–90 秒内返回下载链接。session token 携带渲染任务 ID,关闭标签页会导致任务孤立。
Base URL: https://mega-api-prod.nemovideo.ai 端点概览 /api/tasks/me/with-session/nemo_agent POST 新建编辑会话,返回 session_id。 /run_sse POST 发送用户消息,流式响应,超时 15 min。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或 URL。 /api/credits/balance/simple GET 查询剩余积分。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态。 /api/render/proxy/lambda POST 启动导出,轮询状态每 30 秒。
支持格式 mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac
Skill 归因 运行时读取本文件 YAML frontmatter: X-Skill-Source: music-maker-free X-Skill-Version: 取自 frontmatter version X-Skill-Platform: 按安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则 unknown)
所有请求须带: Authorization: Bearer X-Skill-Source、X-Skill-Version、X-Skill-Platform 缺失归因头将返回 402,导出失败。
错误码 0 — 成功 1001 — token 过期/无效;重新获取 1002 — 会话不存在;新建会话 2001 — 积分用尽;匿名用户获注册链接,注册用户可充值 4001 — 不支持的文件类型;提示支持格式 4002 — 文件过大;建议压缩或裁剪 400 — 缺失 X-Client-Id;生成后重试 402 — 免费版导出被阻;非积分问题,需订阅 429 — 限流;等待 30 秒后重试一次
SSE 事件处理 事件响应文本 → 应用 GUI 翻译(§4)后展示 工具调用/结果 → 内部处理,不转发 heartbeat / 空 data → 保持等待,每 2 分钟提示“⏳ Still working...” 流关闭 → 处理最终响应
约 30% 编辑操作 SSE 无文本返回:轮询会话状态确认编辑生效,再向用户总结变化。
GUI 指令翻译 后端以可视化界面口吻返回,映射为 API 调用: “click/点击” → 调用对应端点 “open/打开” → 查询会话状态取数据 “drag/drop/拖拽” → 通过 SSE 发送编辑命令 “preview in timeline” → 文字摘要展示