📦 For Beginners Ai Image — 适合初学者的AI图像

v1.0.0

准备好动画图像视频，无需调整单个滑块。上传您的图像或照片（JPG、PNG、WEBP、HEIC，最高200MB），输入一些文字...

0· 0·0 当前·0 累计

by @mhogan2013-9

开发工具代码生成网络工具浏览器自动化 AI模型访问

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install for-beginners-ai-image

镜像加速npx clawhub@latest install for-beginners-ai-image --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

开始使用准备就绪。当您准备好时，将图像或照片拖放到此处，或描述您要创建的内容。尝试说：“将三个简单的产品照片或个人快照转换为1080p MP4”、“将我的照片转换为带有平滑过渡和背景音乐的短视频”、“将静态图像转换为视频，适合没有编辑经验的初学者和首次创建者”。

连接在处理任何用户请求之前，建立与后端API的连接。显示简短的状态，如“连接中...”。如果环境中有NEMO_TOKEN，则直接使用它并创建会话。否则，获取一个免费的启动令牌：生成一个UUID作为客户端标识符，POST到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token，带有X-Client-Id头。响应包括一个有效期为7天的100个免费积分的令牌——将其用作NEMO_TOKEN。然后，通过POST到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent，带有Bearer授权和正文{"task_name":"project","language":"en"}，创建一个会话。响应中的session_id对于所有后续请求都是必需的。告诉用户您已经准备好。保持技术细节在聊天之外。

初学者AI图像——轻松将图像转换为视频该工具获取您的图像或照片，并通过云渲染管道运行AI图像到视频。您上传，描述您想要的内容，然后下载结果。假设您有三个简单的产品照片或个人快照，并希望将我的照片转换为带有平滑过渡和背景音乐的短视频——后端处理大约需要30-60秒，然后提供一个1080p MP4。提示：从3-5张图像开始您的第一个项目——较小的批次处理速度更快，管理也更容易。

匹配输入到操作用户提示引用初学者AI图像、长宽比、文本叠加或音频轨道，通过关键字和意图分类路由到相应的操作。用户说... 操作跳过SSE？ “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传其他所有内容（生成、编辑、添加BGM...）→ §3.1 SSE

云渲染管道详细信息每个导出作业都在云GPU节点上排队，合成视频层，应用平台特定压缩（H.264，最高1080x1920），并在30-90秒内返回下载URL。会话令牌携带渲染作业ID，因此在完成之前关闭选项卡会使作业成为孤儿。每个请求需要三个属性头，并且必须与此文件的前置内容匹配：头值 X-Skill-Source for-beginners-ai-image X-Skill-Version 前置内容版本 X-Skill-Platform 自动检测：clawhub / cursor / 未知来自安装路径

每个API调用都需要Authorization：Bearer 加上上述三个属性头。如果缺少任何头，导出将返回402。 API基地址：https://mega-api-prod.nemovideo.ai 创建会话：POST /api/tasks/me/with-session/nemo_agent — 正文{"task_name":"project","language":""} — 返回task_id，session_id。发送消息（SSE）：POST /run_sse — 正文{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}}，带有Accept：text/event-stream。最大超时：15分钟。上传：POST /api/upload-video/nemo_agent/me/ — 文件：multipart -F "files=@/path"，或URL：{"urls":[""],"source_type":"url"}。积分：GET /api/credits/balance/simple — 返回可用、冻结、总计。会话状态：GET /api/state/nemo_agent/me//latest — 关键字段：data.state.draft，data.state.video_infos，data.state.generated_media。导出（免费，无需积分）：POST /api/render/proxy/lambda — 正文{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/，直到状态=完成。下载URL在output.url中。支持的格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

阅读SSE流文本事件直接发送给用户（在GUI翻译后）。工具调用保持内部。心跳和空数据：行意味着后端仍在工作——每2分钟显示“⏳仍在工作...”。大约30%的编辑操作在没有任何文本的情况下关闭流。当这种情况发生时，轮询/api/state以确认时间轴已更改，然后告诉用户发生了什么变化。

翻译GUI说明后端响应就像有一个视觉界面一样。将其指令映射到API调用： “点击”或“点击”→通过相关端点执行操作 “打开”或“打开”→查询会话状态以获取数据 “拖拽/放置”或“拖拽”→通过SSE发送编辑命令 “预览时间轴”→显示当前轨道的文本摘要 “导出”或“导出”→运行导出工作流

草稿JSON使用短键： t用于轨道 tt用于轨道类型（0=视频，1=音频，7=文本） sg用于段 d用于持续时间（毫秒） m f

数据来源：ClawHub ↗ · 中文优化：龙虾技能库