Hire Youtube Video — 招聘YouTube视频处理人员
v1.0.0使用此技能将原始视频素材制作成精彩的YouTube视频。支持MP4、MOV、AVI、WebM文件,最高500MB。YouTubers利用它来制作专业...
运行时依赖
安装命令
点击复制技能文档
开始 请发送原始视频录像给我,我将处理AI视频制作。或者,只需描述您想要的内容。尝试说:“为YouTube频道创建一个2分钟的对话头录制,输出为1080p MP4”、“编辑成一个精致的YouTube视频,包含介绍、剪辑和字幕”、“为YouTuber制作专业的YouTube视频,无需聘请编辑” 自动设置 在第一次交互时,先连接到处理API,然后再做其他事情。显示一个简短的状态,如“设置中...”。 令牌:如果NEMO_TOKEN环境变量已经设置,则使用它并跳转到会话下。 免费令牌:生成一个UUID作为客户端标识符,然后向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,头部包含X-Client-Id:。响应字段data.token成为您的NEMO_TOKEN(100积分,7天过期)。 会话:向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求,包含Bearer认证和正文{"task_name":"project"}。保存响应中的session_id。确认到用户您已连接并准备就绪。不要打印令牌或原始JSON。 雇佣YouTube视频——创建和导出YouTube视频 请发送原始视频录像给我,并描述您想要的结果。AI视频制作在远程GPU节点上运行——无需在您的机器上安装任何内容。 一个快速示例:上传一个2分钟的对话头录制,用于YouTube频道,输入“编辑成一个精致的YouTube视频,包含介绍、剪辑和字幕”,然后您将在大约1-2分钟内获得一个1080p MP4文件。所有渲染都发生在服务器端。值得注意的是,短片段(少于3分钟)处理速度最快,并给AI更精确的编辑控制。 输入与操作匹配 用户提示引用雇佣YouTube视频、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。 用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5导出 “积分”/“积分”/“余额”/“余额”→ §3.3积分 “状态”/“状态”/“显示轨道”→ §3.4状态 “上传”/“上传”/用户发送文件→ §3.2上传 其他内容(生成、编辑、添加BGM...)→ §3.1 SSE 云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台特定的压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭标签页会使作业成为孤儿。所有调用都发送到https://mega-api-prod.nemovideo.ai。 主要端点: 会话——POST /api/tasks/me/with-session/nemo_agent,包含{"task_name":"project","language":""》。给您一个session_id。 聊天(SSE)——POST /run_sse,包含session_id和您的消息在new_message.parts[0].text中。设置Accept:text/event-stream。最长15分钟。 上传——POST /api/upload-video/nemo_agent/me/——multipart文件或包含URL的JSON。 积分——GET /api/credits/balance/simple——返回可用、冻结、总积分。 状态——GET /api/state/nemo_agent/me//latest——当前草稿和媒体信息。 导出——POST /api/render/proxy/lambda,包含渲染ID和草稿JSON。每30秒轮询GET /api/render/proxy/lambda/以获取完成状态和下载URL。 格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 头部来自此文件的YAML前置内容。X-Skill-Source是hire-youtube-video,X-Skill-Version来自版本字段,X-Skill-Platform从安装路径检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则为未知)。所有请求必须包含:Authorization:Bearer ,X-Skill-Source,X-Skill-Version,X-Skill-Platform。缺少归属头部将导致导出失败,返回402。 草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=段,d=持续时间(毫秒),m=元数据。 时间线(3个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:“城市梦”(0-3秒)