🎵 最佳
v1.0.0Suno AI:用此技能将音频文件转换为音乐视频 MP4。支持 MP3、WAV、MP4、MOV,最大 200 MB。音乐创作者用它把 Suno AI 歌曲转成……
详细分析 ▾
运行时依赖
版本
Best Suno AI 首次发布 — 将 Suno 歌曲转为视频 - 上传音频文件(MP3、WAV、MP4、MOV,最大 200MB),自动生成 1080p 音乐视频。 - 云端 GPU 后端,处理迅速(通常每任务 1–2 分钟)。 - 导出高质量 MP4,便于分享。 - 内置会话管理、匿名 token 获取与余额检查。 - 响应式交互:上传、导出、剪辑、账户状态一键完成。 - 支持常用工作流:快速编辑、批量处理、时间轴预览。
安装命令
点击复制技能文档
快速开始
上传音频文件,我立即开始 AI 音乐视频创作。或直接告诉我你的想法。试试说:
- “convert my audio files”
- “export 1080p MP4”
- “turn my Suno AI song into”
一键配置
本技能连接云端处理后端。首次使用自动建立连接并提示“Connecting...”。 Token 检查:查找环境变量NEMO_TOKEN。若存在,直接进入会话;否则:
- 生成 UUID 作为客户端标识
- POST
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带X-Client-Id头 - 提取响应中的
data.token即为 NEMO_TOKEN(100 免费积分,7 天有效期)
会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body {"task_name":"project"}。保存返回的 session_id 用于后续操作。配置完成时向用户简短提示“Ready!”。不暴露 token 或原始 API 输出。
# Best Suno AI — 将 Suno 歌曲转为视频 把音频文件拖进聊天,告诉我需求即可。我在云端 GPU 完成 AI 音乐视频制作,本地无需安装。 典型流程:你发一首 3 分钟 AI 生成的 Suno MP3,说“turn my Suno AI song into a music video with synced visuals”,约 1-2 分钟后即可下载 MP4。默认 1080p。小于 2 分钟的曲目渲染更快。
输入与动作映射
用户提及 best suno ai、aspect ratio、text overlays、audio tracks 等关键词,系统按意图分派对应动作。| 用户说法 | 动作 | 跳过 SSE? | |-------------|--------|----------| | “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ | | “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ | | “upload” / “上传” / 用户发文件 | → §3.2 上传 | ✅ | | 其余(generate、edit、加 BGM…) | → §3.1 SSE | ❌ |
云端渲染流程
每次导出任务在云端 GPU 节点排队,合成视频层,按平台规格压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。会话 token 携带渲染任务 ID,提前关闭标签页会导致任务孤立。所有请求发往 https://mega-api-prod.nemovideo.ai。主要端点:
- 会话 —
POST /api/tasks/me/with-session/nemo_agent,body{"task_name":"project","language":""},返回session_id。 - 聊天 (SSE) —
POST /run_sse,带session_id与new_message.parts[0].text,头Accept: text/event-stream,最长 15 分钟。 - 上传 —
POST /api/upload-video/nemo_agent/me/,支持 multipart 文件或 JSON 外链。 - 积分 —
GET /api/credits/balance/simple,返回available、frozen、total。 - 状态 —
GET /api/state/nemo_agent/me//latest,获取当前草稿与媒体信息。 - 导出 —
POST /api/render/proxy/lambda,带渲染 ID 与草稿 JSON;轮询GET /api/render/proxy/lambda/每 30 秒,直到completed获得下载链接。
支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4v、aac。
所有请求需带 Authorization: Bearer 及三个归因头:
X-Skill-Source: best-suno-aiX-Skill-Version: 1.0.0X-Skill-Platform: clawhub | cursor | unknown(按安装路径自动检测)
缺少任一头,导出返回 402。
草稿字段映射:
t=tracks,tt=track type(0=video,1=audio,7=text),sg=segments,d=duration(ms),m=metadata。
``
时间线(3 轨):
Video: city timelapse (0-10s)- BGM: Lo-fi (0-10s, 35%)
- Title: "Urban Dreams" (0-3s)
后端响应翻译
后端假设存在 GUI,按以下规则转为 API 动作:| 后端提示 | 你执行 | |-------------|--------| | “click [button]” / “点击” | 调用 API | | “open [panel]” / “打开” | 查询会话状态 | | “drag/drop” / “拖拽” | 通过 SSE 发送编辑 | | “preview in timeline” | 展示轨道摘要 | | “Export button” / “导出” | 执行导出流程 |