cloudflare-media

使用 Cloudflare Workers AI 生成图片或语音。触发条件： - 文生图："生成图片"、"文生图"、"text-to-image"、"AI 作图"、"帮我画" - TTS："文字转语音"、"TTS"、"读出来"、"语音合成"、"text-to-speech"

0· 164·0 当前·0 累计

by @n0nsense11 (n0nsense)·MIT-0

AI模型访问云服务图像处理

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install cloudflare-media

镜像加速npx clawhub@latest install cloudflare-media --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

Cloudflare Workers AI — 图片 & 语音生成凭证配置

优先从技能s/cloudflare-media/config.json 或 MEMORY.md 读取 Account ID 和 API 令牌，缺失则询问用户。

第一部分：文生图（Text-to-Image）可选模型一览（共10个） # 模型模型 ID 简介价格传输方式 1 FLUX.2 klein 4B @cf/black-forest-labs/flux-2-klein-4b 高速蒸馏版，4B参数，实时预览 $0.000059/tile multipart 2 FLUX.2 klein 9B @cf/black-forest-labs/flux-2-klein-9b 增强质量版，9B参数 $0.015/first MP multipart 3 FLUX.2 dev @cf/black-forest-labs/flux-2-dev 最高质量，开放权重 $0.00021/tile/step multipart 4 FLUX.1 schnell @cf/black-forest-labs/flux-1-schnell 12B参数，最快4步生成，适合批量 $0.000053/tile JSON body 5 SDXL-Lightning @cf/bytedance/stable-diffusion-xl-lightning 极快文生图，几步完成，Beta $0.00/step JSON body 6 DreamShaper 8 LCM @cf/lykon/dreamshaper-8-lcm 强逼真写实风格，不牺牲创意范围免费 JSON body 7 Leonardo Lucid Origin @cf/leonardo/lucid-origin 强提示跟随，支持文字渲染 $0.007/tile JSON body 8 Leonardo Phoenix 1.0 @cf/leonardo/phoenix-1.0 最佳文字生成，提示 adherence 最强 $0.0058/tile JSON body

FLUX.2 klein 4B / 9B / dev（Black Forest Labs）

特点：高速/高质量/最高质量三档，multipart/form-data 传输

参数必填默认说明 prompt ✅ — 图片描述文本 width ❌ 1024 宽度 256~1024（64倍数） height ❌ 1024 高度 256~1024（64倍数） steps ❌ — 步数（参考值25） curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/black-forest-labs/flux-2-klein-4b" \ -H "Authorization: Bearer {令牌}" \ -F "prompt=a sun设置 over the ocean" \ -F "width=1024" -F "height=1024"

返回： {"结果":{"image":"base64..."}} → 保存为 .png

FLUX.1 schnell（Black Forest Labs）

特点： 12B 参数，极快（默认4步），适合批量生成，JSON body

参数必填默认说明 prompt ✅ — 图片描述（最长2048字符） steps ❌ 4 步数（1~8，越高越慢） curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/black-forest-labs/flux-1-schnell" \ -H "Authorization: Bearer {令牌}" \ -H "Content-Type: 应用/json" \ -d '{"prompt":"a cyberpunk cat","steps":4}'

返回： {"image":"base64..."} → 保存为 .jpg

SDXL-Lightning（ByteDance）Beta

特点：极快几步生成，支持 img2img，输出为原始 JPEG 二进制流

参数必填默认说明 prompt ✅ — 图片描述 negative_prompt ❌ — 反向提示词 width ❌ 1024 宽度 256~2048 height ❌ 1024 高度 256~2048 num_steps ❌ 20 步数（1~20）图形界面dance ❌ 7.5 提示跟随度 strength ❌ 1 img2img 强度（0~1）种子 ❌ — 随机种子 image / image_b64 ❌ — img2img 输入图（数组或base64） mask / mask_b64 ❌ — inpAInting mask curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/bytedance/stable-diffusion-xl-lightning" \ -H "Authorization: Bearer {令牌}" \ -H "Content-Type: 应用/json" \ -d '{"prompt":"a cyberpunk cat","num_steps":10}'

返回：原始 JPEG 二进制流 → 保存为 .jpg

DreamShaper 8 LCM（lykon）

特点：强逼真写实风格，LCM 加速，支持 img2img + inpAInting，参数同 SDXL-Lightning

参数必填默认说明 prompt ✅ — 图片描述 negative_prompt ❌ — 反向提示词 width ❌ 1024 宽度 256~2048 height ❌ 1024 高度 256~2048 num_steps ❌ 20 步数（1~20）图形界面dance ❌ 7.5 提示跟随度 strength ❌ 1 img2img 强度（0~1）种子 ❌ — 随机种子 image / image_b64 ❌ — img2img 输入图 mask / mask_b64 ❌ — inpAInting mask curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/lykon/dreamshaper-8-lcm" \ -H "Authorization: Bearer {令牌}" \ -H "Content-Type: 应用/json" \ -d '{"prompt":"a rea列出ic photo of a cat","num_steps":8}'

返回：原始 JPEG 二进制流 → 保存为 .jpg

Leonardo Lucid Origin

参数必填默认说明 prompt ✅ — 图片描述 width ❌ 1120 宽度 0~2500 height ❌ 1120 高度 0~2500 图形界面dance ❌ 4.5 提示跟随度（0~10） num_steps ❌ — 步数（1~40）种子 ❌ — 随机种子

返回： {"结果":{"image":"base64..."}} → 保存为 .png

Leonardo Phoenix 1.0

参数必填默认说明 prompt ✅ — 图片描述 width ❌ 1024 宽度 0~2048 height ❌ 1024 高度 0~2048 图形界面dance ❌ 2 提示跟随度（2~10） num_steps ❌ 25 步数（1~50） negative_prompt ❌ — 反向提示词种子 ❌ — 随机种子

返回：原始 JPEG 二进制流 → 保存为 .jpg

第二部分：TTS（Text-to-Speech）可选模型一览（共4个） # 模型模型 ID 简介价格 1 Deepgram Aura-2 英语 @cf/deepgram/aura-2-en 40个声音，上下文感知，自然停顿表达 $0.03/1k字符 2 Deepgram Aura-2 西班牙语 @cf/deepgram/aura-2-es 同上，专为西班牙语优化 $0.03/1k字符 3 Deepgram Aura-1 @cf/deepgram/aura-1 12个声音，Aura-2 低配版，半价 $0.015/1k字符 4 MyShell MeloTTS @cf/myshell-AI/melotts 多语言（en/es/fr/zh/ja/ko），费用最低 $0.0002/分钟 Deepgram Aura 声音列表

Aura-2（40个）： amalthea, andromeda, apollo, arcas, aries, asteria, athena, atlas, aurora, cal列出a, cora, cordelia, delia, draco, electra, harmonia, helena, hera, hermes, hyperion, iris, janus, juno, jupiter, luna, mars, minerva, nep调优, odysseus, ophelia, orion, orpheus, pandora, phoebe, pluto, saturn, thalia, theia, vesta, zeus

默认声音：luna（女声，温暖）

Aura-1（12个）： angus, asteria, arcas, orion, orpheus, athena, luna, zeus, perseus, helios, hera, stella

默认声音：angus（男声）

Deepgram Aura 参数参数必填默认说明 text ✅ — 要转语音的文本 speaker ❌ luna/angus 声音名称 encoding ❌ mp3 编码：linear16/flac/mulaw/alaw/mp3/opus/aac sample_rate ❌ — 采样率（Hz） bit_rate ❌ — 比特率（bps） curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/deepgram/aura-2-en" \ -H "Authorization: Bearer {令牌}" \ -H "Content-Type: 应用/json" \ -d '{"text":"Hello world","speaker":"luna"}'

返回：原始 MP3 二进制流 → 保存为 .mp3

MyShell MeloTTS 参数参数必填默认说明 prompt ✅ — 要转语音的文本 lang ❌ en 语言：en/es/fr/zh/ja/ko curl -X POST "https://API.cloudflare.com/命令行工具ent/v4/accounts/{ACCOUNT}/AI/运行/@cf/myshell-AI/melotts" \ -H "Authorization: Bearer {

License

运行时依赖

安装命令

技能文档

相关技能推荐