🎙️ TranscribeSpeech To Text — 语音转文字

v1.0.0

通过 SkillBoss API Hub(STT,由 Whisper 等驱动)

0· 58·0 当前·0 累计
kirkraman 头像by @kirkraman (KirkRaman)
下载技能包
最后更新
2026/4/21
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能与其声明的用途(将本地音频发送至 SkillBoss 进行 STT)保持一致,且仅请求单个 API key;主要风险在于上传文件至外部服务时可能意外泄露敏感音频。
评估建议
该技能功能如其所述:读取本地音频文件并上传至 SkillBoss 进行转录,使用 SKILLBOSS_API_KEY。安装前,请确认你信任 api.skillbossai.com 及其隐私/计费政策;除非接受将敏感音频上传至该服务,否则避免转录高度敏感内容;妥善保管 API key(如泄露立即轮换),并限制 agent 可访问的文件路径。如需本地转录或更严格的数据控制,请考虑使用本地/离线 STT 方案。...
详细分析 ▾
用途与能力
名称/描述(通过 SkillBoss 进行语音转文本)与声明的要求(SKILLBOSS_API_KEY)以及调用 SkillBoss /v1/pilot 端点的运行时指令保持一致。所请求的环境变量适用于调用第三方 API。
指令范围
SKILL.md 指示智能体读取本地音频文件(open('/path/audio.mp3')),将其 base64 编码后 POST 到外部 API。这对 transcribe skill 是预期行为,但也意味着任何被指向的音频都会被上传到 SkillBoss——若涉及敏感音频,可能存在隐私/外泄风险。
安装机制
仅含指令的技能,无安装规范或捆绑代码;技能本身不会写入磁盘,降低供应链风险。
凭证需求
仅需一个 API key(SKILLBOSS_API_KEY),其用量与调用第三方 STT API 成正比。该 key 用于访问外部服务并可能产生费用/账单;不会索取任何无关凭据。
持久化与权限
该技能未标记 always:true,且使用默认调用设置。它不要求系统级配置,也不修改其他技能。未请求提升持久性。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/21

- 首次发布基于 SkillBoss API Hub 的语音转文字功能,由 Whisper 等模型驱动。 - 支持音频文件转录及音频翻译为英文。 - 无需本地模型下载,API 自动选择最佳模型。 - 需设置 SKILLBOSS_API_KEY 环境变量。 - 附带简易 Python 示例,便于快速上手。

无害

安装命令

点击复制
官方npx clawhub@latest install martin-transcribe
镜像加速npx clawhub@latest install martin-transcribe --registry https://cn.longxiaskill.com

技能文档

调用 SkillBoss API Hub 的 /v1/pilot 接口,即可基于 OpenAI Whisper 及其他语音识别模型完成语音转文字(STT)。

快速开始(Python) ``python import requests, base64, os

SKILLBOSS_API_KEY = os.environ["SKILLBOSS_API_KEY"] API_BASE = "https://api.skillbossai.com/v1"

def pilot(body: dict) -> dict: r = requests.post( f"{API_BASE}/pilot", headers={"Authorization": f"Bearer {SKILLBOSS_API_KEY}", "Content-Type": "application/json"}, json=body, timeout=60, ) return r.json()

# 转录音频文件 audio_b64 = base64.b64encode(open("/path/audio.mp3", "rb").read()).decode() result = pilot({"type": "stt", "inputs": {"audio_data": audio_b64, "filename": "audio.mp3"}}) text = result["result"]["text"] print(text)

# 将音频翻译为英文 result = pilot({"type": "stt", "inputs": {"audio_data": audio_b64, "filename": "audio.m4a", "task": "translate"}}) text = result["result"]["text"] print(text) `

注意事项

  • 无需本地下载模型;SkillBoss API Hub 自动路由至最优 STT 模型。
  • 需设置环境变量 SKILLBOSS_API_KEY
  • 返回文本位于 result["result"]["text"]`。
数据来源ClawHub ↗ · 中文优化:龙虾技能库