📦 Video With Music — 带有音乐的视频

v1.0.0

跳过专业编辑软件的学习曲线。描述您想要的内容 —— 添加与视频情绪相匹配的背景音乐 —— 并获得音乐背景...

0· 0·0 当前·0 累计

by @tk8544-b

开发工具代码生成视频处理教育学习

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install video-with-music

镜像加速npx clawhub@latest install video-with-music --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

开始请发送您的视频片段，我将处理AI音乐添加。或者，只需描述您想要的内容。尝试说：“将60秒的旅行蒙太奇片段添加到1080p MP4中”、“添加与视频情绪相匹配的背景音乐”、“为TikTok创作者添加社交媒体视频的背景音乐” 自动设置在第一次交互时，在做任何其他事情之前，先连接到处理API。显示简短的状态，如“设置中...”。令牌：如果NEMO_TOKEN环境变量已经设置，请使用它并跳转到会话下。免费令牌：生成UUID作为客户端标识符，然后将其发布到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token，头部为X-Client-Id：。响应字段data.token成为您的NEMO_TOKEN（100积分，7天过期）。会话：将POST发布到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent，带有Bearer身份验证和正文{"task_name":"project"}。从响应中保存session_id。确认您已连接并准备就绪。不要打印令牌或原始JSON。视频伴随音乐——添加音乐到您的视频该工具获取您的视频片段并通过云渲染管道运行AI音乐添加。您上传，描述您想要的内容，然后下载结果。假设您有一个60秒的旅行蒙太奇片段，并希望添加与视频情绪相匹配的背景音乐——后端处理大约需要30-60秒，然后提供1080p MP4。提示：较短的片段可以更准确地将音乐同步到视频的节奏。输入与操作的匹配用户提示引用视频伴随音乐、长宽比、文本叠加或音频轨道，通过关键字和意图分类路由到相应的操作。用户说... 操作跳过SSE？ “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示音轨”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传其他内容（生成、编辑、添加BGM...）→ §3.1 SSE 云渲染管道详细信息每个导出作业都在云GPU节点上排队，合成视频层，应用平台规格压缩（H.264，最高1080x1920），并在30-90秒内返回下载URL。会话令牌携带渲染作业ID，因此在完成之前关闭选项卡会使作业成为孤儿。每个API调用都需要Authorization：Bearer 加上上面的三个属性头。如果缺少任何头部，导出将返回402。三个属性头需要在每个请求中，并且必须与此文件的前置内容匹配：头部值 X-Skill-Source video-with-music X-Skill-Version 前置内容版本 X-Skill-Platform 自动检测：clawhub / cursor / 未知来自安装路径 API基地址：https://mega-api-prod.nemovideo.ai 创建会话：POST /api/tasks/me/with-session/nemo_agent — 正文{"task_name":"project","language":""} — 返回task_id、session_id。发送消息（SSE）：POST /run_sse — 正文{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}}，带有Accept：text/event-stream。最大超时：15分钟。上传：POST /api/upload-video/nemo_agent/me/ — 文件：multipart -F "files=@/path"，或URL：{"urls":[""],"source_type":"url"}。积分：GET /api/credits/balance/simple — 返回可用、冻结、总计。会话状态：GET /api/state/nemo_agent/me//latest — 关键字段：data.state.draft、data.state.video_infos、data.state.generated_media。导出（免费，无需积分）：POST /api/render/proxy/lambda — 正文{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/，直到状态=完成。下载URL在output.url中。支持的格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。错误代码 0 — 成功，正常继续 1001 — 令牌过期或无效；通过/api/auth/anonymous-token重新获取 1002 — 会话未找到；创建一个新会话 2001 — 积分不足；匿名用户获取注册链接，注册用户补充积分 4001 — 不支持的文件类型；显示接受的格式 4002 — 文件太大；建议压缩或修剪 400 — 缺少X-Client-Id；生成一个并重试 402 — 免费计划导出被阻塞；不是积分问题，订阅级别 429 — 限速；等待30秒并重试一次翻译GUI说明后端响应就像有一个可视化界面一样。将其说明映射到API调用： “点击”或“点击”→通过相关端点执行操作 “打开”或“打开”→查询会话状态以获取数据 “拖拽”或“拖拽”→通过SSE发送编辑命令 “预览时间轴”→显示当前音轨的文本摘要 “导出”或“导出”→运行导出工作流 SSE事件处理事件操作文本响应应用GUI翻译（§4），呈现给用户工具调用/结果处理内部，不转发心跳/空数据：继续等待。每2分钟：“⏳仍在工作...” 流关闭处理最终结果

数据来源：ClawHub ↗ · 中文优化：龙虾技能库