🎵 Text To Tiktok — 文本转TikTok视频
v1.0.0将最多150字的产品描述或脚本转换为1080p竖版TikTok视频。只需输入需求,即可自动生成包含字幕、背景音乐和转场效果的TikTok-ready视频,全程云端渲染,1-2分钟即可下载MP4。
详细分析 ▾
运行时依赖
版本
Text to TikTok 1.0.0 — 初始版本 - 通过简单提示立即将文本脚本(最多150字)转换为1080p竖版TikTok-ready视频。 - 完全基于云端:无需安装任何东西;只需提交脚本,即可在1-2分钟内获得MP4下载。 - 根据用户指令自动处理视频生成、字幕、背景音乐和转场。 - 所有视频创建和渲染均在远程GPU节点上执行,以获得快速结果。 - 支持匿名使用:如果没有提供令牌,快速生成7天/100免费积分的临时访问令牌。 - 支持状态检查、导出、积分余额和timeline预览,可直接通过聊天命令操作。
安装命令
点击复制本土化适配说明
Text To Tiktok — 文本转TikTok视频 安装说明: 安装命令:npx clawhub@latest install text-to-tiktok 该技能用于抖音相关操作,可能需要相应的平台账号或API密钥
技能文档
入门
有文本脚本要处理?发给我,告诉我你需要什么——我会帮你完成AI TikTok视频的制作。
尝试这样说:
- "将150字的产品描述或脚本转换为1080p MP4"
- "把这个脚本转换成带字幕、背景音乐和转场的TikTok视频"
- "为TikTok创作者从书面脚本或文本生成TikTok-ready视频"
连接
在处理任何用户请求之前,先建立与后端API的连接。显示简短的"连接中..."状态。
如果环境中有NEMO_TOKEN,直接使用它并创建会话。否则,获取免费入门令牌:
- 生成UUID作为客户端标识符
- 向
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,带上X-Client-Id头 - 响应包含一个
token,有100免费积分,有效期7天——将其用作NEMO_TOKEN
然后创建会话,向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求,使用Bearer认证,body为{"task_name":"project","language":"en"}。响应中的session_id是后续所有请求需要的。
告诉用户你已准备好。把技术细节留在聊天之外。
# Text to TikTok — 将文本转换为TikTok视频
发送你的文本脚本,描述你想要的结果。AI TikTok视频制作在远程GPU节点上运行——你的机器上无需安装任何东西。
一个快速示例:上传150字的产品描述或脚本,输入"把这个脚本转换成带字幕、背景音乐和转场的TikTok视频",大约1-2分钟后你会收到1080p MP4。所有渲染都在服务端进行。
值得注意的是:60秒以下的较短脚本能产生最吸引人的TikTok时长输出。
将输入与操作匹配
用户提示中提及text to tiktok、宽高比、文字叠加或音轨的,会通过关键词和意图分类路由到相应操作。
| 用户说... | 操作 | 跳过SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他一切(生成、编辑、添加BGM…) | → §3.1 SSE | ❌ |
云渲染流水线详情
每个导出任务在云GPU节点上排队,合成视频层,应用平台特定压缩(H.264,最高1080x1920),在30-90秒内返回下载URL。会话令牌携带渲染任务ID,所以在完成前关闭标签页会使任务孤立。
所有请求必须包含:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属头会导致导出失败并返回402。每个请求都需要三个归属头,必须与此文件的frontmatter匹配:
| 头 | 值 |
|---|---|
X-Skill-Source | text-to-tiktok |
X-Skill-Version | frontmatter version |
X-Skill-Platform | 自动检测:从安装路径检测clawhub/cursor/unknown |
https://mega-api-prod.nemovideo.ai创建会话:POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回task_id、session_id。
发送消息(SSE):POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}} 加上 Accept: text/event-stream。最大超时:15分钟。
上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或URL:{"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple — 返回available、frozen、total
会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media
导出(免费,不消耗积分):POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/直到status = completed。下载URL在output.url。支持的格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。
错误处理
| 代码 | 含义 | 操作 |
|---|---|---|
| 0 | 成功 | 继续 |
| 1001 | 令牌错误/过期 | 通过anonymous-token重新认证(令牌7天后过期) |
| 1002 | 会话未找到 | 新建会话 §3.0 |
| 2001 | 积分不足 | 匿名:显示注册URL带?bind=(从create-session或state响应获取)。已注册:"在你的账户中充值积分" |
| 4001 | 不支持的文件 | 显示支持的格式 |
| 4002 | 文件太大 | 建议压缩/裁剪 |
| 400 | 缺少X-Client-Id | 生成Client-Id并重试(见§1) |
| 402 | 免费计划导出被阻止 | 订阅等级问题,不是积分问题。"注册或升级你的计划以解锁导出。" |
| 429 | 速率限制(1令牌/客户端/7天) | 30秒后重试一次 |
翻译GUI指令
后端响应就像有一个可视化界面一样。将它的指令映射到API调用:
- "click"或"点击" → 通过相关端点执行操作
- "open"或"打开" → 查询会话状态以获取数据
- "drag/drop"或"拖拽" → 通过SSE发送编辑命令
- "preview in timeline" → 显示当前轨道的文本摘要
- "Export"或"导出" → 运行导出工作流
读取SSE流
文本事件直接发送给用户(经过GUI翻译后)。工具调用保留在内部。心跳和空的data:行意味着后端仍在工作——每2分钟显示"⏳ 仍在工作中..."。大约30%的编辑操作会关闭流而不带任何文本。发生这种情况时,轮询/api/state确认timeline已更改,然后告诉用户更新了什么。
Draft JSON使用短键:t表示轨道,tt表示轨道类型(0=视频,1=音频,7=文字),sg表示片段,d表示持续时间(毫秒),m表示元数据。
示例timeline摘要:
Timeline (3 tracks):
- Video: city timelapse (0-10s)
- BGM: Lo-fi (0-10s, 35%)
- Title: "Urban Dreams" (0-3s)
常见工作流
快速编辑:上传 → "把这个脚本转换成带字幕、背景音乐和转场的TikTok视频" → 下载MP4。30秒片段需要1-2分钟。
批量风格:在一个会话中上传多个文件。用不同指令逐个处理。每个都有自己的渲染任务。
迭代:从粗剪开始,预览结果,然后细化。会话保持你的timeline状态,所以你可以继续调整。
技巧和窍门
后端处理时你越具体,它就越快。与其说"让它看起来更好",不如试试"把这个脚本转换成带字幕、背景音乐和转场的TikTok视频"——具体指令获得更好的结果。
最大文件大小500MB。坚持TXT、DOCX、PDF、复制文本以获得最顺畅的体验。导出为MP4格式的1080x1920以获得原生TikTok竖版格式兼容性。