cloudflare-media
v4使用 Cloudflare Workers AI 生成图片或语音。触发条件: - 文生图:"生成图片"、"文生图"、"text-to-image"、"AI 作图"、"帮我画" - TTS:"文字转语音"、"TTS"、"读出来"、"语音合成"、"text-to-speech"
运行时依赖
安装命令
点击复制技能文档
Cloudflare Workers AI — 图片 & 语音生成 凭证配置
优先从 技能s/cloudflare-media/config.json 或 MEMORY.md 读取 Account ID 和 API 令牌,缺失则询问用户。
第一部分:文生图(Text-to-Image) 可选模型一览(共10个) # 模型 模型 ID 简介 价格 传输方式 1 FLUX.2 klein 4B @cf/black-forest-labs/flux-2-klein-4b 高速蒸馏版,4B参数,实时预览 $0.000059/tile multipart 2 FLUX.2 klein 9B @cf/black-forest-labs/flux-2-klein-9b 增强质量版,9B参数 $0.015/first MP multipart 3 FLUX.2 dev @cf/black-forest-labs/flux-2-dev 最高质量,开放权重 $0.00021/tile/step multipart 4 FLUX.1 schnell @cf/black-forest-labs/flux-1-schnell 12B参数,最快4步生成,适合批量 $0.000053/tile JSON body 5 SDXL-Lightning @cf/bytedance/stable-diffusion-xl-lightning 极快文生图,几步完成,Beta $0.00/step JSON body 6 DreamShaper 8 LCM @cf/lykon/dreamshaper-8-lcm 强逼真写实风格,不牺牲创意范围 免费 JSON body 7 Leonardo Lucid Origin @cf/leonardo/lucid-origin 强提示跟随,支持文字渲染 $0.007/tile JSON body 8 Leonardo Phoenix 1.0 @cf/leonardo/phoenix-1.0 最佳文字生成,提示 adherence 最强 $0.0058/tile JSON body
- FLUX.2 klein 4B / 9B / dev(Black Forest Labs)
特点: 高速/高质量/最高质量三档,multipart/form-data 传输
参数 必填 默认 说明 prompt ✅ — 图片描述文本 width ❌ 1024 宽度 256~1024(64倍数) height ❌ 1024 高度 256~1024(64倍数) steps ❌ — 步数(参考值25) curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/black-forest-labs/flux-2-klein-4b" \ -H "Authorization: Bearer {令牌}" \ -F "prompt=a sun设置 over the ocean" \ -F "width=1024" -F "height=1024"
返回: {"结果":{"image":"base64..."}} → 保存为 .png
- FLUX.1 schnell(Black Forest Labs)
特点: 12B 参数,极快(默认4步),适合批量生成,JSON body
参数 必填 默认 说明 prompt ✅ — 图片描述(最长2048字符) steps ❌ 4 步数(1~8,越高越慢) curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/black-forest-labs/flux-1-schnell" \ -H "Authorization: Bearer {令牌}" \ -H "Content-Type: 应用/json" \ -d '{"prompt":"a cyberpunk cat","steps":4}'
返回: {"image":"base64..."} → 保存为 .jpg
- SDXL-Lightning(ByteDance)Beta
特点: 极快几步生成,支持 img2img,输出为原始 JPEG 二进制流
参数 必填 默认 说明 prompt ✅ — 图片描述 negative_prompt ❌ — 反向提示词 width ❌ 1024 宽度 256~2048 height ❌ 1024 高度 256~2048 num_steps ❌ 20 步数(1~20) 图形界面dance ❌ 7.5 提示跟随度 strength ❌ 1 img2img 强度(0~1) 种子 ❌ — 随机种子 image / image_b64 ❌ — img2img 输入图(数组或base64) mask / mask_b64 ❌ — inpAInting mask curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/bytedance/stable-diffusion-xl-lightning" \ -H "Authorization: Bearer {令牌}" \ -H "Content-Type: 应用/json" \ -d '{"prompt":"a cyberpunk cat","num_steps":10}'
返回: 原始 JPEG 二进制流 → 保存为 .jpg
- DreamShaper 8 LCM(lykon)
特点: 强逼真写实风格,LCM 加速,支持 img2img + inpAInting,参数同 SDXL-Lightning
参数 必填 默认 说明 prompt ✅ — 图片描述 negative_prompt ❌ — 反向提示词 width ❌ 1024 宽度 256~2048 height ❌ 1024 高度 256~2048 num_steps ❌ 20 步数(1~20) 图形界面dance ❌ 7.5 提示跟随度 strength ❌ 1 img2img 强度(0~1) 种子 ❌ — 随机种子 image / image_b64 ❌ — img2img 输入图 mask / mask_b64 ❌ — inpAInting mask curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/lykon/dreamshaper-8-lcm" \ -H "Authorization: Bearer {令牌}" \ -H "Content-Type: 应用/json" \ -d '{"prompt":"a rea列出ic photo of a cat","num_steps":8}'
返回: 原始 JPEG 二进制流 → 保存为 .jpg
- Leonardo Lucid Origin
返回: {"结果":{"image":"base64..."}} → 保存为 .png
- Leonardo Phoenix 1.0
返回: 原始 JPEG 二进制流 → 保存为 .jpg
第二部分:TTS(Text-to-Speech) 可选模型一览(共4个) # 模型 模型 ID 简介 价格 1 Deepgram Aura-2 英语 @cf/deepgram/aura-2-en 40个声音,上下文感知,自然停顿表达 $0.03/1k字符 2 Deepgram Aura-2 西班牙语 @cf/deepgram/aura-2-es 同上,专为西班牙语优化 $0.03/1k字符 3 Deepgram Aura-1 @cf/deepgram/aura-1 12个声音,Aura-2 低配版,半价 $0.015/1k字符 4 MyShell MeloTTS @cf/myshell-AI/melotts 多语言(en/es/fr/zh/ja/ko),费用最低 $0.0002/分钟 Deepgram Aura 声音列表
Aura-2(40个): amalthea, andromeda, apollo, arcas, aries, asteria, athena, atlas, aurora, cal列出a, cora, cordelia, delia, draco, electra, harmonia, helena, hera, hermes, hyperion, iris, janus, juno, jupiter, luna, mars, minerva, nep调优, odysseus, ophelia, orion, orpheus, pandora, phoebe, pluto, saturn, thalia, theia, vesta, zeus
默认声音:luna(女声,温暖)
Aura-1(12个): angus, asteria, arcas, orion, orpheus, athena, luna, zeus, perseus, helios, hera, stella
默认声音:angus(男声)
Deepgram Aura 参数 参数 必填 默认 说明 text ✅ — 要转语音的文本 speaker ❌ luna/angus 声音名称 encoding ❌ mp3 编码:linear16/flac/mulaw/alaw/mp3/opus/aac sample_rate ❌ — 采样率(Hz) bit_rate ❌ — 比特率(bps) curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/deepgram/aura-2-en" \ -H "Authorization: Bearer {令牌}" \ -H "Content-Type: 应用/json" \ -d '{"text":"Hello world","speaker":"luna"}'
返回: 原始 MP3 二进制流 → 保存为 .mp3
MyShell MeloTTS 参数 参数 必填 默认 说明 prompt ✅ — 要转语音的文本 lang ❌ en 语言:en/es/fr/zh/ja/ko curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/myshell-AI/melotts" \ -H "Authorization: Bearer {