意大利语视频制作工具
v1.0.0只需输入需求,即可将三张产品照片和一段配音 MP3 一键生成 1080p 精美意大利语视频。无论是制作专业级 I...
详细分析 ▾
运行时依赖
安装命令
点击复制技能文档
入门 有视频片段或图片?直接发给我并告诉我需求——我来搞定 AI 视频制作。 试试说: “把三张产品图和一段配音 MP3 合成 1080p MP4” “crea un video promozionale in italiano con sottotitoli e musica di sottofondo” “为意大利语创作者生成带文字与转场的专业意大利语视频”
快速设置 本技能连接云端处理后端。首次使用自动建立连接并提示“Connecting...”。 Token 检查:在环境中查找 NEMO_TOKEN。找到则直接进入会话创建;否则:
- 生成 UUID 作为客户端标识
- POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带 X-Client-Id 头
- 从响应提取 data.token,即 NEMO_TOKEN(100 免费积分,7 天有效期)
Video Maker Italiano — 创建并导出意大利语视频 把视频片段或图片拖进聊天,告诉我需求。我将在云端 GPU 完成 AI 视频制作,无需本地安装。 典型流程:发三张产品图+配音 MP3,说“crea un video promozionale in italiano con sottotitoli e musica di sottofondo”,30-60 秒后得到可下载的 MP4,默认 1080p。 提示:素材控制在 2 分钟内可显著提速。
输入匹配动作 用户提及 video maker italiano、画面比例、文字层、音轨等关键词时,通过意图分类路由到对应动作。 用户说… → 动作 (Skip SSE?) “export/导出/download/send me the video” → §3.5 Export ✅ “credits/积分/balance/余额” → §3.3 Credits ✅ “status/状态/show tracks” → §3.4 State ✅ “upload/上传/用户发文件” → §3.2 Upload ✅ 其余(生成、编辑、加 BGM…) → §3.1 SSE ❌
云端渲染流程 每次导出任务在云端 GPU 节点排队,合成视频层并按平台规格压缩(H.264,最大 1080×1920),30-90 秒内返回下载链接。 会话 token 携带渲染任务 ID,关闭标签页会导致任务孤立。 所有请求指向 https://mega-api-prod.nemovideo.ai。 主要端点:
- Session — POST /api/tasks/me/with-session/nemo_agent,body {"task_name":"project","language":""},返回 session_id
- Chat (SSE) — POST /run_sse,带 session_id 与 new_message.parts[0].text,Accept: text/event-stream,最长 15 分钟
- Upload — POST /api/upload-video/nemo_agent/me/,支持 multipart 文件或 JSON 外链
- Credits — GET /api/credits/balance/simple,返回可用/冻结/总量
- State — GET /api/state/nemovideo.ai/me//latest,获取当前草稿与媒体信息
- Export — POST /api/render/proxy/lambda,带 render ID 与草稿 JSON;轮询 GET /api/render/proxy/lambda/ 每 30 秒获取完成状态与下载地址
支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 请求头来自 YAML frontmatter:X-Skill-Source=video-maker-italiano,X-Skill-Version 取自 version 字段,X-Skill-Platform 按安装路径检测(~/.clawhub/=clawhub,~/.cursor/skills/=cursor,其余 unknown)。 所有请求必须带:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺失将返回 402。
草稿 JSON 简写: t=tracks,tt=track type(0=video,1=audio,7=text),sg=segments,d=duration(ms),m=metadata 示例时间轴摘要: Timeline (3 tracks):
- Video: city timelapse (0-10s)
- BGM: Lo-fi (0-10s, 35%)
- Title: "Urban Dreams" (0-3s)
GUI 指令映射 后端以可视化界面方式返回,需转为 API 调用: “click/点击” → 调用对应端点 “open/打开” → 查询会话状态 “drag/drop/拖拽” → 通过 SSE 发送编辑命令 “preview in timeline” → 文字展示当前轨道摘要 “Export/导出” → 执行导出流程
SSE 流读取 文本事件直接展示给用户(经 GUI 翻译),工具调用内部处理。 心跳与空 data: 行表示后端仍在运行——每 2 分钟显示“⏳ Still working...”。 约 30% 编辑操作无返回文本,此时轮询 /api/state 确认时间轴变更,再告知用户更新内容。
错误码 0 — 成功,继续 1001 — token 过期或无效