首页龙虾技能列表 › ElevenLabs STT OpenClaw — ElevenLabs 语音转文本(本地 CLI)

ElevenLabs STT OpenClaw — ElevenLabs 语音转文本(本地 CLI)

v1.2.2

使用 ElevenLabs 语音转文本(Scribe v2)从本地 CLI 转录音频文件。支持对话者识别、事件、JSON 输出、Webhook 和高级语音转文本选项。

0· 431·2 当前·2 累计
by @xhunx (xHUNx)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/2/26
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能的文件、指令和所需环境变量与 ElevenLabs 语音转文本的本地 CLI 封装一致。仅要求 ElevenLabs API 密钥,并使用标准本地工具将音频发送到 ElevenLabs 服务。
评估建议
["该技能如其所述:流式传输或上传音频到 ElevenLabs 进行转录,并可选使用 ElevenLabs TTS 进行播放。","安装/使用前:1) 了解您的音频(和 ELEVENLABS_API_KEY)将被发送到 api.elevenlabs.io — 仅使用您信任的密钥来暴露音频到该服务。2) 转录本地文件必须设置 ALLOW_LOCAL_FILE=true。3) 实时监听模式将捕获麦克风音频 — 仅在您打算流式传输麦克风输入时运行。4) 在本地检查脚本(它们是普通 shell/python 脚本)并考虑使用具有有限权限或使用限制的专用 API 密钥。5) 如果计划使用 Webhook,请确保注册的 Webhook 端点是安全的,因为 ElevenLabs 将将转录结果交付到它。如果任何这些行为是意外的,请不要运行脚本并旋转/吊销用于测试的任何密钥。"]...
详细分析 ▾
用途与能力
名称/描述(ElevenLabs STT CLI)与实现相符:脚本调用 ElevenLabs STT 和 TTS 端点,使用 ffmpeg 进行音频转换,websocat 进行实时 Websocket,jq/curl 进行 API 交互。所需二进制文件和 ELEVENLABS_API_KEY 适合声明的功能。
指令范围
SKILL.md 和脚本一致地指示发送音频到 ElevenLabs 端点,并可选流式传输麦克风音频。一个小的不匹配:README 和 transcribe.sh 需要 ALLOW_LOCAL_FILE=true 来操作本地文件,但 SKILL.md 元数据仅列出 ELEVENLABS_API_KEY。脚本还读取可选环境变量(ELEVENLABS_VOICE_ID, RT_*),这些在元数据中未声明。除此之外,指令保持在声明的 STT/TTS 范围内,不尝试读取无关的主机文件或秘密。
安装机制
无安装规格;这是一个依赖现有系统二进制的指令和脚本包。安装程序未执行远程下载或存档提取,因此安装风险较低。
凭证需求
仅 ELEVENLABS_API_KEY 是必需的,并适用于调用 ElevenLabs API。脚本引用额外的环境变量(ALLOW_LOCAL_FILE, ELEVENLABS_VOICE_ID, RT_DEVICE/RT_LANG/RT_TTS/RT_VOICE_ID),这些是可选/默认的,但未在技能元数据中声明 — 在使用前应注意此不匹配。未请求无关凭证。
持久化与权限
该技能不请求持久或提升的平台权限;始终:false,并且它不修改其他技能或系统范围的代理配置。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.2.22026/2/25

安全强化:验证输入、删除 .env 源、保护 TTS

● 无害

安装命令 点击复制

官方npx clawhub@latest install elevenlabs-stt-openclaw
镜像加速npx clawhub@latest install elevenlabs-stt-openclaw --registry https://cn.clawhub-mirror.com

技能文档

ElevenLabs 语音转文本(本地 CLI)

用法

运行 scripts/transcribe.sh 脚本,带有音频文件路径或 URL。 示例:
scripts/transcribe.sh /path/to/audio.mp3
scripts/transcribe.sh /path/to/audio.mp3 --diarize --lang en
scripts/transcribe.sh /path/to/audio.mp3 --json
scripts/transcribe.sh /path/to/audio.mp3 --webhook --webhook-metadata '{"job":"call-001"}'
scripts/transcribe.sh --url https://example.com/audio.mp3 --lang en

环境

在运行前,在 shell 或 OpenClaw 环境中设置 ELEVENLABS_API_KEY

备注

  • 默认使用 scribe_v2(语音转文本模型)并使用文件系统锁避免并行请求。
  • 需要 curljq
  • 对于异步工作流,请使用 --webhook,可选 --webhook-id--webhook-metadata
  • 通过 scripts/realtime.sh(需要 ffmpeg + websocat)提供实时流式传输,使用 scribe_v2_realtime 模型。
  • 通过 scripts/live_listen.sh 提供实时监听模式,支持切换/始终开启模式和可选 TTS 响应。
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务