首页龙虾技能列表 › Sag — ElevenLabs语音合成

🗣️ Sag — ElevenLabs语音合成

v1.0.0

ElevenLabs 文本转语音工具,提供 Mac 风格的 say 命令体验,支持多种语音和输出格式。

22· 22,500·1150 当前·1182 累计·💬 1
by @steipete (Peter Steinberger)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/2/26
安全扫描
VirusTotal
无害
查看报告
OpenClaw
可疑
medium confidence
该技能的运行时指令与 ElevenLabs TTS CLI 匹配,但注册元数据(无环境变量/安装)与 SKILL.md(需要 ELEVENLABS_API_KEY 并建议安装第三方 brew 公式)冲突,包元数据不一致,安装前需验证。
评估建议
安装或提供 API 密钥前:(1) 验证源代码/主页(https://sag.sh)和 Homebrew 公式(steipete/tap/sag)是否合法;(2) 尽量创建范围受限的 ElevenLabs API 密钥(最小权限);(3) 谨慎安装来自第三方 Homebrew tap 的 CLI——审查公式及其上游仓库;(4) 注意注册元数据和 SKILL.md 关于所需环境变量/安装信息不一致——要求发布者更正元数据或提供来源;(5) 如安装,先在本地确认 sag 二进制文件的行为,再向代理提供密钥,仅将 ELEVENLABS_API_KEY 授予您信任的环境。...
详细分析 ▾
用途与能力
SKILL.md 明确实现了 ElevenLabs TTS 封装(需要 sag CLI 和 ELEVENLABS_API_KEY),与技能名称/描述一致。但注册级要求声称环境变量和安装为'无',与 SKILL.md 元数据中列出的二进制文件和 ELEVENLABS_API_KEY 冲突——此不匹配可疑(可能是打包/元数据错误),应予解决。
指令范围
指令范围狭窄,仅通过 sag CLI 生成 TTS,写入输出文件(如 /tmp/voice-reply.mp3)并返回。不指示读取无关文件或泄露其他环境变量。引用了额外的可选环境变量名(SAG_API_KEY、ELEVENLABS_VOICE_ID/SAG_VOICE_ID),与 TTS 使用相关。
安装机制
SKILL.md 元数据建议通过 Homebrew 公式从 steipete/tap(第三方)安装。Homebrew 公式是 CLI 的预期安装路径,但使用第三方 tap 有一定风险——且注册元数据遗漏了此安装规范,造成不一致,应根据主页/来源检查。
凭证需求
请求的凭证(ELEVENLABS_API_KEY;可选 SAG_API_KEY 和语音 ID 变量)与 ElevenLabs TTS 客户端成比例。无无关凭证请求。不一致之处在于注册元数据声明无必需环境变量,而 SKILL.md 期望 API 密钥。
持久化与权限
该技能不请求 always:true 或任何提升的/持久的平台权限。可由用户调用并在调用时使用 CLI;自主调用仍然可能(平台默认),但不与其他高风险标志组合。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/1/5
● 无害

安装命令 点击复制

官方npx clawhub@latest install sag
镜像加速npx clawhub@latest install sag --registry https://cn.clawhub-mirror.com

技能文档

Use sag for ElevenLabs TTS with local playback.

API key (required)

  • ELEVENLABS_API_KEY (preferred)
  • SAG_API_KEY also supported by the CLI

Quick start

  • sag "Hello there"
  • sag speak -v "Roger" "Hello"
  • sag voices
  • sag prompting (model-specific tips)

Model notes

  • Default: eleven_v3 (expressive)
  • Stable: eleven_multilingual_v2
  • Fast: eleven_flash_v2_5

Pronunciation + delivery rules

  • First fix: respell (e.g. "key-note"), add hyphens, adjust casing.
  • Numbers/units/URLs: --normalize auto (or off if it harms names).
  • Language bias: --lang en|de|fr|... to guide normalization.
  • v3: SSML not supported; use [pause], [short pause], [long pause].
  • v2/v2.5: SSML supported; not exposed in sag.

v3 audio tags (put at the entrance of a line)

  • [whispers], [shouts], [sings]
  • [laughs], [starts laughing], [sighs], [exhales]
  • [sarcastic], [curious], [excited], [crying], [mischievously]
  • Example: sag "[whispers] keep this quiet. [short pause] ok?"

Voice defaults

  • ELEVENLABS_VOICE_ID or SAG_VOICE_ID

Confirm voice + speaker before long output.

Chat voice responses

When Peter asks for a "voice" reply (e.g., "crazy scientist voice", "explain in voice"), generate audio and send it:

# Generate audio file
sag -v Clawd -o /tmp/voice-reply.mp3 "Your message here"

# Then include in reply: # MEDIA:/tmp/voice-reply.mp3

Voice character tips:

  • Crazy scientist: Use [excited] tags, dramatic pauses [short pause], vary intensity
  • Calm: Use [whispers] or slower pacing
  • Dramatic: Use [sings] or [shouts] sparingly

Default voice for Clawd: lj2rcrvANS3gaWWnczSX (or just -v Clawd)

数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务