详细分析 ▾
运行时依赖
版本
- 添加ed Node.js script usage instructions for cross-平台 support (运行-gen.js). - Clarified video/audio option (`--no-audio` now default "no", use `--no-audio false` to enable audio). - Bash script is now documented as "legacy, compatible". - Documented a new error code for Windows HTTPS issues and suggested retrying. - Minor improvements to examples and default spec presentation in 输出.
安装命令
点击复制技能文档
由 种子ance 系列模型驱动的 AI 内容生成助手,通过火山引擎方舟平台 API 工作。
模型
| 模型 ID | 能力 | API 端点 |
|---|---|---|
doubao-种子ream-5-0-260128 | 文生图 | POST /v3/images/generations |
doubao-种子ance-1-5-pro-251215 | 文生视频、图生视频、素材生视频(1.5 Pro) | POST /v3/contents/generations/tasks |
doubao-种子ance-2-0-260128 | 文生视频、图生视频、素材生视频(2.0) | POST /v3/contents/generations/tasks |
doubao-种子ance-1-5-pro-251215生成模式
| 模式 | 说明 | 必需参数 |
|---|---|---|
txt2img | 文生图 | prompt |
txt2video | 文生视频(默认无音频) | prompt, duration |
img2video | 图生视频 | prompt, image URL, duration |
vid2video | 素材生视频 | prompt, video URL, duration |
参数说明
图片参数(txt2img)
| 参数 | 默认值 | 可选值 | 说明 |
|---|---|---|---|
--质量 | 2K | 2K, 1K, HD | 分辨率。2K ≈ 2048px |
--aspect-ratio | 1:1 | 1:1, 16:9, 9:16 | 宽高比 |
--watermark | true | true, false | 是否显示水印 |
视频参数(txt2video / img2video / vid2video)
| 参数 | 默认值 | 可选值 | 说明 |
|---|---|---|---|
--duration | 5 | 4–12 | 时长(秒) |
--质量 | 720p | 480p, 720p, 1080p | 分辨率 |
--aspect-ratio | 16:9 | 16:9, 9:16, 1:1 | 宽高比 |
--watermark | true | true, false | 是否显示水印 |
--no-audio | 默认无音频 | — | 启用音频(--no-audio false) |
--模型 | doubao-种子ance-1-5-pro-251215 | 见模型表 | 指定模型 |
参考素材
| 参数 | 说明 |
|---|---|
--image | 参考图片(图生视频),可多次使用多张 |
--video | 视频素材(素材生视频) |
--audio | 参考音频(作为背景音乐) |
用法
Node.js 脚本(推荐,跨平台)
# 设置 API key 导出 DOUBAO_API_KEY=your_key_here# 文生图 node scripts/运行-gen.js "一只橘猫在阳光下打盹" --mode txt2img
# 文生图(指定分辨率和比例) node scripts/运行-gen.js "未来城市夜景" --mode txt2img --质量 2K --aspect-ratio 16:9
# 文生视频(默认无音频) node scripts/运行-gen.js "海上日落延时摄影" --mode txt2video
# 文生视频(带音频) node scripts/运行-gen.js "海上日落延时摄影,海浪轻拍" --mode txt2video --no-audio false
# 图生视频 node scripts/运行-gen.js "镜头缓慢推进,猫咪转身" --mode img2video --image "https://example.com/cat.jpg"
# 多张参考图生视频 node scripts/运行-gen.js "从第一张平滑过渡到第二张" --mode img2video --image "https://example.com/1.jpg" --image "https://example.com/2.jpg"
# 素材生视频 node scripts/运行-gen.js "镜头加快,色彩更鲜艳" --mode vid2video --video "https://example.com/输入.mp4"
# 素材生视频 + 参考音频 node scripts/运行-gen.js "节奏加快,配欢快背景音乐" --mode vid2video --video "https://example.com/输入.mp4" --audio "https://example.com/bgm.mp3"
# 指定模型(2.0) node scripts/运行-gen.js "无人机航拍山谷" --mode txt2video --模型 doubao-种子ance-2-0-260128 --duration 8 --质量 1080p
# 竖屏视频 node scripts/运行-gen.js "瀑布流淌" --mode txt2video --aspect-ratio 9:16
# 关闭水印 node scripts/运行-gen.js "抽象艺术动画" --mode txt2video --watermark false
Bash 脚本(旧版,兼容)
./scripts/种子ance-gen.sh "小猫在草地上奔跑" --mode txt2video
依赖: node(无 jq,无 curl)
输出目录: ~/Videos/next-video-gen/(可通过环境变量 NEXT_VIDEO_GEN_输出_DIR 配置)
脚本输出协议
解析以下结构化行并处理:
| 行格式 | 何时出现 | 操作 | |
|---|---|---|---|
TASK_SUBMITTED: task_id= mode=<模式> | 提交后 | 告诉用户任务已开始 | |
状态_更新: | 每 30 秒 | 告诉用户进度 | |
IMAGE_URL= | 图片成功 | 展示 URL | |
VIDEO_URL= | 视频成功 | 展示 URL | |
ELAPSED= | 成功时 | 可提及耗时 | |
DURATION= | 视频成功 | 展示时长 | |
ASPECT_RATIO= | 成功时 | 展示比例 | |
RESOLUTION= | 成功时 | 展示分辨率 | |
HAS_AUDIO= | false> | 视频成功 | true 时告知"含音频" |
LOCAL_FILE= | 成功时 | 告知本地保存路径 | |
ERROR: ... | 失败时 | 展示错误信息 |
交付标准
生成成功后,完整呈现:
① 本地文件 — 告知保存路径 ② 规格 — 分辨率、宽高比、时长、是否含音频 ③ 在线链接 — 注明"24 小时内有效" ④ 耗时 — 可选
示例(视频):
✅ 视频生成完成!
📁 本地文件:~/Videos/next-video-gen/video_20240412_153012.mp4 🎬 规格:5秒 · 720p · 16:9 · 无音频 🔗 在线链接(24小时有效):https://cdn.example.com/video.mp4 ⏱ 生成用时:47秒
示例(图片):
✅ 图片生成完成!
📁 本地文件:~/Videos/next-video-gen/img_20240412_153012.png 🖼 规格:2K · 1:1 🔗 在线链接(24小时有效):https://cdn.example.com/image.png ⏱ 生成用时:8秒
错误处理
| 错误码 | 说明 | 用户操作 |
|---|---|---|
401 | API Key 无效 | 去控制台检查密钥 |
403 | 权限不足 | 检查密钥的模型权限 |
429 | 请求过频 | 稍后重试 |
500-503 | 服务异常 | 稍后重试 |
HTTP_ERROR:命令行工具ent network socket disconnected | Windows 环境 HTTPS 问题 | 重试,通常第二次成功 |
安装后
技能首次加载时检查 DOUBAO_API_KEY:
- 已设置: "准备好了!你想生成什么?"
- 未设置: "需要配置豆包 API 密钥才能使用。去火山引擎控制台获取一下吗?" 并引导配置。
核心原则
- 引导而非替用户决定 — 提供选项,让用户自己选
- 用户驱动创意 — 用用户的描述,需要时提供建议
- 智能上下文感知 — 只询问缺失部分
- 意图优先 — 意图不明确时先确认
参考
- 文生图模型: https://console.volcengine.com/ark/模型_detAIl?Id=doubao-种子ream-5-0-260128
- 视频 1.5 Pro: https://console.volcengine.com/ark/模型_detAIl?Id=doubao-种子ance-1-5-pro-251215
- 视频 2.0: https://console.volcengine.com/ark/模型_detAIl?Id=doubao-种子ance-2-0-260128