🎬 Descript
v1.0.0Text To Video:用此技能将文本脚本转换为AI生成的视频。支持TXT、DOCX、PDF、SRT文件,最大50MB。内容创作者用它把书面…
详细分析 ▾
运行时依赖
版本
Descript Text to Video 1.0.0 — 初始版本: - 1–2 分钟内将文本脚本(TXT、DOCX、PDF、SRT,最大 50MB)即时转为 AI 生成的 1080p MP4 视频。 - 通过简单聊天提示完成上传、导出、积分与实时编辑。 - 自动会话/身份验证,保障云端渲染安全。 - 内置详细指引与错误处理,体验流畅。 - 支持多种工作流:快速单视频、批量生成、迭代编辑。
安装命令
点击复制技能文档
快速开始
把文字脚本丢给我,立刻开始 AI 视频创作。或者一句话告诉我你想做什么。
试试说:
- “convert my text script”
- “export 1080p MP4”
- “turn this script into a video”
建立连接
处理任何请求前,先连后端 API,提示“Connecting...”。若环境变量已有 NEMO_TOKEN,直接用它建会话;否则:
- 生成 UUID 作为 client ID
- POST
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带X-Client-Id头 - 返回含 100 免费积分、7 天有效的
token,用作 NEMO_TOKEN
接着创建会话:
POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent
Bearer 鉴权,body {"task_name":"project","language":"en"}
拿到 session_id,后续请求皆需。
告诉用户“已就绪”,技术细节不展示。
# Descript Text to Video — 将脚本秒变成片 把文字脚本发给我,说需求即可。云端 GPU 完成渲染,本地零安装。 典型场景:200 字博客开头 → 1-2 分钟后拿到带画面、字幕的 1080p MP4 下载。 脚本 ≤150 字时成片更紧凑。
意图路由表
| 用户说… | 动作 | 跳过 SSE? | |---------|------|------------| | “export”/“导出”/“download”/“send me the video” | → §3.5 导出 | ✅ | | “credits”/“积分”/“balance”/“余额” | → §3.3 积分 | ✅ | | “status”/“状态”/“show tracks” | → §3.4 状态 | ✅ | | “upload”/“上传”/用户发文件 | → §3.2 上传 | ✅ | | 其余(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |云端渲染流程
导出任务进 GPU 队列,合成图层 → H.264 压缩(最高 1080×1920)→ 30-90 秒返回下载链接。session_id 关联任务,提前关标签会丢作业。 主要端点(皆需 Authorization: Bearer ):
- 会话 —
POST /api/tasks/me/with-session/nemo_agent - 对话 SSE —
POST /run_sse,Accept: text/event-stream,最长 15 min - 上传 —
POST /api/upload-video/nemo_agent/me/ - 积分 —
GET /api/credits/balance/simple - 状态 —
GET /api/state/nemo_agent/me//latest - 导出 —
POST /api/render/proxy/lambda→ 轮询GET /api/render/proxy/lambda/
支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac
调用头必须:
X-Skill-Source: descript-text-to-videoX-Skill-Version: 1.0.0X-Skill-Platform: clawhub|cursor|unknown