📦 Music Generator Hd — 音乐生成器 HD
v1.0.0生成 text or mood prompts into HD music videos with this 技能. Works with MP4, MOV, WAV, MP3 files up to 200MB. content 创建器s use it for generating h...
运行时依赖
安装命令
点击复制技能文档
开始使用 请发送您的文本或情绪提示,我将处理AI音乐生成。或者,您可以描述您想要的内容。尝试说:“生成一个60秒的欢快背景音乐提示到一个1080p MP4”、“生成一个高清背景音乐轨道用于我的旅行视频”、“为内容创作者生成高质量的音乐轨道,同步到视频内容”。
快速开始设置 本技能连接到一个云处理后端。在第一次使用时,自动设置连接并通知用户(“连接中...”)。令牌检查:在环境中查找NEMO_TOKEN。如果找到,则跳转到会话创建。否则:生成一个UUID作为客户端标识符,POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,包含X-Client-Id头部,提取响应中的data.token —— 这是您的NEMO_TOKEN(100个免费积分,7天过期)。会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,包含Bearer认证和正文{"task_name":"project"}。保留返回的session_id用于所有操作。当设置完成时,通知用户“准备就绪!”。不要暴露令牌或原始API输出。
音乐生成器HD —— 为视频生成高清音乐 该工具接受您的文本或情绪提示,并通过云渲染管道运行AI音乐生成。您上传、描述您想要的内容,然后下载结果。假设您有一个60秒的欢快背景音乐提示,并想要生成一个高清背景音乐轨道用于您的旅行视频 —— 后端处理它大约需要30-60秒,然后提供一个1080p MP4。提示:较短的持续时间提示会产生更集中的和一致的音乐输出。
匹配输入到操作 用户提示引用音乐生成器HD、长宽比、文本覆盖或音频轨道被路由到相应的操作通过关键字和意图分类。用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频” → §3.5 导出 “积分”/“积分”/“余额”/“余额” → §3.3 积分 “状态”/“状态”/“显示轨道” → §3.4 状态 “上传”/“上传”/用户发送文件 → §3.2 上传 其他所有内容(生成、编辑、添加BGM...) → §3.1 SSE
云渲染管道详细信息 每个导出作业在云GPU节点上排队,合成视频层,应用平台规格压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。每个请求需要三个属性头:Header 值 X-Skill-Source music-generator-hd X-Skill-Version frontmatter版本 X-Skill-Platform auto-detect:clawhub / cursor / unknown from install path 每个API调用需要Authorization:Bearer 加上上述三个属性头。如果任何头部缺失,导出将返回402。API基地址:https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent —— 正文{"task_name":"project","language":""} —— 返回task_id、session_id。发送消息(SSE):POST /run_sse —— 正文{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},包含Accept:text/event-stream。最大超时:15分钟。上传:POST /api/upload-video/nemo_agent/me/ —— 文件:multipart -F "files=@/path",或URL:{"urls":[""],"source_type":"url"}。积分:GET /api/credits/balance/simple —— 返回可用、冻结、总积分。会话状态:GET /api/state/nemo_agent/me//latest —— 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media。导出(免费,无积分):POST /api/render/proxy/lambda —— 正文{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/,直到状态=完成。下载URL在output.url。支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
阅读SSE流 文本事件直接发送给用户(在GUI翻译后)。工具调用保持内部。心跳和空数据:行意味着后端仍在工作 —— 每2分钟显示“⏳仍在工作...”。大约30%的编辑操作在没有任何文本的情况下关闭流。当这种情况发生时,轮询/api/state以确认时间线已更改,然后告诉用户什么已更新。
翻译GUI说明 后端响应就像有一个可视化界面一样。将其指令映射到API调用:“点击”或“点击”→通过相关端点执行操作“打开”或“打开”→查询会话状态以获取数据“拖拽/放置”或“拖拽”→通过SSE发送编辑命令“预览在时间线中”→显示当前轨道的文本摘要“导出”或“导出”→运行导出工作流。草稿JSON使用短键:t用于轨道,tt用于轨道类型(0=视频,1=音频,7=文本),sg用于段,d用于持续时间(毫秒),m用于元数据。时间线摘要示例:时间线(3个轨道):1. 视频:城市延时(0-10秒)2. BGM:Lo-fi