🎵 Mureka Ai — Mureka AI — AI音乐生成
v1.0.0云端 AI 音乐生成服务。上传音频文件(MP3、WAV、MP4、AAC,最大 200MB),描述您的音乐目标,1-2 分钟内即可收到可下载的 1080p MP4。专为音乐人和创作者设计,无需手动声音设计,无需本地安装。
详细分析 ▾
运行时依赖
版本
Mureka AI 1.0.0 — 初始版本:- 从上传的音频(MP3、WAV、MP4、AAC 最大 200MB)即时生成带乐器伴奏的完整歌曲。- 简单工作流:上传文件,描述您的音乐目标,在 1-2 分钟内收到可下载的 1080p MP4。- 开箱即用,适合音乐人和创作者——无需手动声音设计,无需本地安装。- 专为快速迭代设计:管理会话,预览时间线,通过聊天优化编辑。- 全云端处理,自动免费试用令牌,包含直观的错误处理。
安装命令
点击复制技能文档
入门
分享您的音频文件,我将开始 AI 音乐生成。或者直接告诉我您的想法。
请尝试说:
- "generate my audio files"
- "export 1080p MP4"
- "generate a full song with instruments"
自动设置
首次交互时,先连接到处理 API,然后再执行其他操作。显示简短状态如"正在设置..."。
令牌:如果 NEMO_TOKEN 环境变量已设置,请使用它并跳到下面的会话部分。
免费令牌:生成 UUID 作为客户端标识符,然后向 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 发送 POST 请求,带上头 X-Client-Id: 。响应字段 data.token 成为您的 NEMO_TOKEN(100 积分,7 天过期)。
会话:向 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent 发送 POST 请求,使用 Bearer 认证,请求体为 {"task_name":"project"}。从响应中保存 session_id。向用户确认您已连接并准备就绪。不要打印令牌或原始 JSON。
# Mureka AI — 从音频生成歌曲
在聊天中放下您的音频文件,告诉我您的需求。我将在云端 GPU 上处理 AI 音乐生成——您无需在本地安装任何东西。以下是一个典型用例:您发送一段 30 秒的人声旋律录音,请求"generate a full song with instruments from my hummed melody"(根据我哼唱的旋律生成带乐器伴奏的完整歌曲),大约 1-2 分钟后您就可以下载 MP4 文件。默认情况下,整个过程以 1080p 运行。值得一提的是——较短的种子片段会产生更聚焦和一致的结果。
将输入匹配到操作
引用 mureka ai、宽高比、文字叠加或音轨的用户提示通过关键词和意图分类路由到相应的操作。
| 用户说... | 操作 | 跳过 SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加背景音乐…) | → §3.1 SSE | ❌ |
云端渲染管道详情
每个导出任务在云端 GPU 节点上排队,该节点合成视频层,应用平台特定压缩(H.264,最高 1080x1920),并在 30-90 秒内返回下载 URL。会话令牌携带渲染作业 ID,因此在完成前关闭标签页会使作业失效。每个请求都需要三个归因头,且必须与此文件的 frontmatter 匹配:
| 头 | 值 |
|---|---|
X-Skill-Source | mureka-ai |
X-Skill-Version | frontmatter version |
X-Skill-Platform | 自动检测:从安装路径检测 clawhub / cursor / unknown |
Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归因头将导致导出失败并返回 402。API 基础 URL:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent — 请求体 {"task_name":"project","language":""} — 返回 task_id、session_id。
发送消息(SSE):POST /run_sse — 请求体 {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},带 Accept: text/event-stream。最大超时:15 分钟。
上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple — 返回 available、frozen、total
会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media
导出(免费,不消耗积分):POST /api/render/proxy/lambda — 请求体 {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/,直到 status = completed。下载 URL 在 output.url。支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
SSE 事件处理
| 事件 | 操作 |
|---|---|
| 文本响应 | 应用 GUI 翻译(第 4 节),呈现给用户 |
| 工具调用/结果 | 内部处理,不转发 |
heartbeat / 空 data: | 继续等待。每 2 分钟:"⏳ 仍在工作中..." |
| 流关闭 | 处理最终响应 |
翻译 GUI 指令
后端响应就像有一个可视化界面。将其指令映射到 API 调用:
- "click" 或 "点击" → 通过相关端点执行操作
- "open" 或 "打开" → 查询会话状态以获取数据
- "drag/drop" 或 "拖拽" → 通过 SSE 发送编辑命令
- "preview in timeline" → 显示当前轨道的文本摘要
- "Export" 或 "导出" → 运行导出工作流
草稿 JSON 使用短键:t 表示轨道,tt 表示轨道类型(0=视频,1=音频,7=文字),sg 表示片段,d 表示时长(毫秒),m 表示元数据。时间线摘要示例:
时间线(3 个轨道):
- 视频:城市延时摄影 (0-10s)
- 背景音乐:Lo-fi (0-10s, 35%)
- 标题:"城市梦想" (0-3s)
错误代码
0— 成功,正常继续1001— 令牌过期或无效;通过/api/auth/anonymous-token重新获取1002— 找不到会话;创建新会话2001— 积分不足;匿名用户收到带?bind=的注册链接,注册用户充值4001— 不支持的文件类型;显示接受的格式4002— 文件太大;建议压缩或裁剪400— 缺少X-Client-Id;生成一个并重试402— 免费计划导出被阻止;不是积分问题,是订阅等级429— 速率限制;等待 30 秒并重试一次
常见工作流
快速编辑:上传 → "generate a full song with instruments from my hummed melody"(根据我哼唱的旋律生成带乐器伴奏的完整歌曲)→ 下载 MP4。30 秒片段需要 1-2 分钟。
批量风格:在一个会话中上传多个文件。使用不同指令逐个处理。每个文件都有独立的渲染。
迭代:从粗剪开始,预览结果,然后优化。会话会保留您的时间线状态,因此您可以继续调整。
技巧和窍门
当您具体描述时,后端处理更快。不要说"make it look better"(让它看起来更好),而是尝试"generate a full song with instruments from my hummed melody"(根据我哼唱的旋律生成带乐器伴奏的完整歌曲)——具体的指令会产生更好的结果。最大文件大小为 200MB。坚持使用 MP3、WAV、MP4、AAC 以获得最流畅的体验。导出为 MP4 以将您生成的音轨与社交媒体的视觉效果配对。