🎬 Descript

v1.0.0

Text To Video：用此技能将文本脚本转换为AI生成的视频。支持TXT、DOCX、PDF、SRT文件，最大50MB。内容创作者用它把书面…

0· 41·0 当前·0 累计

by @peand-rover (peandrover adam)

文件处理网络工具开发工具视频处理系统工具

下载技能包

最后更新

2026/4/22

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

medium confidence

该 skill 请求的 token 与 API 调用与其声明用途（云端视频渲染）相符，但存在细微的元数据不一致，以及几处文件系统读取提示，安装前请注意。

评估建议

该技能的功能如其描述：它会将脚本和媒体上传至 mega-api-prod.nemovideo.ai，并使用 NEMO_TOKEN（或获取的匿名令牌）创建渲染任务。安装前，请确认你信任 nemovideo.ai 处理上传内容（不要在文件中包含敏感 PII 或机密）。注意 SKILL.md 提示代理可能会探测安装路径及 ~/.config/nemovideo/ 路径——如担心文件暴露，请询问你的代理运行时如何限制技能文件访问。同时验证技能来源/所有者（未提供主页）；如需更高保障，请从已知供应商或提供可访问主页及源码仓库的技能获取。...

详细分析 ▾

✓ 用途与能力

该 skill 将文本转换为云端渲染视频，仅需一个服务凭证（NEMO_TOKEN）用于 nemo/videocloud 端点。该凭证与所述功能相匹配。一处小不一致：SKILL.md 元数据中列出配置路径为 ~/.config/nemovideo/，而注册表摘要显示无需配置路径。

ℹ 指令范围

运行时指令引导 agent 创建会话、上传文件、使用 SSE、轮询渲染，并 POST 到 https://mega-api-prod.nemovideo.ai——均符合远程渲染服务的行为。该 skill 还指示 agent 读取本文件 YAML frontmatter 中的 attribution 头，并检测安装路径（~/.clawhub 或 ~/.cursor/skills/），这需要检查用户主目录下的路径；读取自身 SKILL.md 是预期行为，但自动探测安装路径或配置目录可能访问超出必要范围的用户文件系统。

✓ 安装机制

纯指令型技能，无安装配置、无代码文件——安装风险最低。不请求任何外部下载或包安装。

✓ 凭证需求

仅需一个凭证（NEMO_TOKEN）。若未提供令牌，SKILL.md 会提供从服务获取匿名令牌的回退流程。不会请求无关密钥或广泛的凭证访问权限。

✓ 持久化与权限

技能未被强制包含（always:false），也未请求持久化的系统级权限。允许正常的自主调用（disable-model-invocation:false），这是技能所预期的；说明中未声称会修改其他技能或全局代理设置。

安全有层次，运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/22

Descript Text to Video 1.0.0 — 初始版本： - 1–2 分钟内将文本脚本（TXT、DOCX、PDF、SRT，最大 50MB）即时转为 AI 生成的 1080p MP4 视频。 - 通过简单聊天提示完成上传、导出、积分与实时编辑。 - 自动会话/身份验证，保障云端渲染安全。 - 内置详细指引与错误处理，体验流畅。 - 支持多种工作流：快速单视频、批量生成、迭代编辑。

● 无害

安装命令

点击复制

官方npx clawhub@latest install descript-text-to-video

镜像加速npx clawhub@latest install descript-text-to-video --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

快速开始

把文字脚本丢给我，立刻开始 AI 视频创作。或者一句话告诉我你想做什么。

试试说：

“convert my text script”
“export 1080p MP4”
“turn this script into a video”

建立连接

处理任何请求前，先连后端 API，提示“Connecting...”。

若环境变量已有 NEMO_TOKEN，直接用它建会话；否则：

生成 UUID 作为 client ID
POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token，带 X-Client-Id 头
返回含 100 免费积分、7 天有效的 token，用作 NEMO_TOKEN

接着创建会话： POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent Bearer 鉴权，body {"task_name":"project","language":"en"} 拿到 session_id，后续请求皆需。告诉用户“已就绪”，技术细节不展示。

# Descript Text to Video — 将脚本秒变成片把文字脚本发给我，说需求即可。云端 GPU 完成渲染，本地零安装。典型场景：200 字博客开头 → 1-2 分钟后拿到带画面、字幕的 1080p MP4 下载。脚本 ≤150 字时成片更紧凑。

意图路由表

| 用户说… | 动作 | 跳过 SSE？ | |---------|------|------------| | “export”/“导出”/“download”/“send me the video” | → §3.5 导出 | ✅ | | “credits”/“积分”/“balance”/“余额” | → §3.3 积分 | ✅ | | “status”/“状态”/“show tracks” | → §3.4 状态 | ✅ | | “upload”/“上传”/用户发文件 | → §3.2 上传 | ✅ | | 其余（生成、编辑、加 BGM…） | → §3.1 SSE | ❌ |

云端渲染流程

导出任务进 GPU 队列，合成图层 → H.264 压缩（最高 1080×1920）→ 30-90 秒返回下载链接。 session_id 关联任务，提前关标签会丢作业。

主要端点（皆需 Authorization: Bearer ）：

会话 — POST /api/tasks/me/with-session/nemo_agent
对话 SSE — POST /run_sse，Accept: text/event-stream，最长 15 min
上传 — POST /api/upload-video/nemo_agent/me/
积分 — GET /api/credits/balance/simple
状态 — GET /api/state/nemo_agent/me//latest
导出 — POST /api/render/proxy/lambda → 轮询 GET /api/render/proxy/lambda/

支持格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac

调用头必须：

X-Skill-Source: descript-text-to-video
X-Skill-Version: 1.0.0
X-Skill-Platform: clawhub|cursor|unknown

缺 header 导出报 402。