🎵 Ai — AI
v1.0.0使用此技能将音频文件生成与音乐同步的视频。支持 MP3、WAV、AAC、FLAC 格式,最大 200MB。音乐人和内容创作者用它进行 ge...
详细分析 ▾
运行时依赖
版本
Initial release — 生成 music-同步ed videos from audio files using cloud GPU processing. - Accepts MP3, WAV, AAC, FLAC files up to 200MB; returns 1080p MP4 videos in 1–2 minutes. - Simple 设置up: automatic 令牌/会话 creation; 100 free credits for new users. - Handles 上传s, 导出s, credits, project 状态, and audio/video editing through clear user prompts. - 导出s and processing are managed via 安全 API calls; jobs remAIn tied to your 会话. - DetAIled error handling for common issues (令牌, credits, file size/type). - Supports multiple 导出 格式化s and 图形界面des for common music/video 工作流s.
安装命令
点击复制本土化适配说明
Ai — AI 安装说明: 安装命令:npx clawhub@latest install ai-video-generator-from-music
技能文档
快速开始
把音频文件发给我,立刻开始 AI 视频创作。或直接告诉我你的想法。试试说:
- “生成我的音频文件”
- “导出 1080p MP4”
- “生成带视觉的音乐视频”
一键配置
本技能连接云端处理后端。首次使用自动建立连接并提示“连接中…”。 Token 检查:查找环境变量NEMO_TOKEN。若存在,直接进入会话;否则:
- 生成 UUID 作为客户端 ID
- POST
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带X-Client-Id头 - 提取响应中的
data.token即为 NEMO_TOKEN(100 免费积分,7 天有效期)
会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body {"task_name":"project"}。保存返回的 session_id 用于后续操作。
配置完成时向用户简短提示“就绪!”。不要暴露 token 或原始 API 输出。
# AI Video Generator from Music — 把音乐变成同步视频 把音频文件发给我,并描述想要的效果。AI 视频创作在远程 GPU 节点运行——本地无需安装。 示例:上传 3 分钟 MP3,输入“生成与歌曲节拍和情绪匹配的音乐视频”,约 1-2 分钟返回 1080p MP4。所有渲染在服务器完成。 注意:短于 2 分钟的音轨处理更快,视觉同步更精准。
输入与动作映射
用户提及 ai video generator from music、画面比例、文字叠加、音轨等关键词时,通过意图分类路由到对应动作。| 用户说法 | 动作 | 跳过 SSE? | |-------------|------|------------| | “export”/“导出”/“download”/“发我视频” | → §3.5 导出 | ✅ | | “credits”/“积分”/“balance”/“余额” | → §3.3 积分 | ✅ | | “status”/“状态”/“show tracks” | → §3.4 状态 | ✅ | | “upload”/“上传”/用户发送文件 | → §3.2 上传 | ✅ | | 其余(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |
云端渲染管线
每次导出任务在云端 GPU 节点排队,合成视频层,按平台规格压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。 会话 token 携带渲染任务 ID,若完成前关闭标签页,任务将成孤儿。 请求头取自本文件 YAML 头:X-Skill-Source 为 ai-video-generator-from-music,X-Skill-Version 取 version 字段,X-Skill-Platform 按安装路径检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,否则 unknown)。
所有 API 调用需带 Authorization: Bearer 及上述三枚头;缺失则返回 402。 API 基址:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回 task_id, session_id
发送消息(SSE):POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},Accept: text/event-stream,最长 15 分钟
上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple — 返回 available, frozen, total
会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft, data.state.video_infos, data.state.generated_media
导出(免费,不扣积分):POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/ 直至 status=completed,下载链接在 output.url。支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
SSE 流读取
文本事件直接展示(经 GUI 翻译)。工具调用内部处理。心跳与空data: 行表示后端仍在运行——每 2 分钟显示“⏳ 仍在处理…”。约 30% 编辑操作会无文本直接关闭流。