🎙️ TranscribeSpeech To Text — 语音转文字

v1.0.0

通过 SkillBoss API Hub（STT，由 Whisper 等驱动）

0· 58·0 当前·0 累计

by @kirkraman (KirkRaman)

API开发存储部署系统工具

下载技能包

最后更新

2026/4/21

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

high confidence

该技能与其声明的用途（将本地音频发送至 SkillBoss 进行 STT）保持一致，且仅请求单个 API key；主要风险在于上传文件至外部服务时可能意外泄露敏感音频。

评估建议

该技能功能如其所述：读取本地音频文件并上传至 SkillBoss 进行转录，使用 SKILLBOSS_API_KEY。安装前，请确认你信任 api.skillbossai.com 及其隐私/计费政策；除非接受将敏感音频上传至该服务，否则避免转录高度敏感内容；妥善保管 API key（如泄露立即轮换），并限制 agent 可访问的文件路径。如需本地转录或更严格的数据控制，请考虑使用本地/离线 STT 方案。...

详细分析 ▾

✓ 用途与能力

名称/描述（通过 SkillBoss 进行语音转文本）与声明的要求（SKILLBOSS_API_KEY）以及调用 SkillBoss /v1/pilot 端点的运行时指令保持一致。所请求的环境变量适用于调用第三方 API。

ℹ 指令范围

SKILL.md 指示智能体读取本地音频文件（open('/path/audio.mp3')），将其 base64 编码后 POST 到外部 API。这对 transcribe skill 是预期行为，但也意味着任何被指向的音频都会被上传到 SkillBoss——若涉及敏感音频，可能存在隐私/外泄风险。

✓ 安装机制

仅含指令的技能，无安装规范或捆绑代码；技能本身不会写入磁盘，降低供应链风险。

✓ 凭证需求

仅需一个 API key（SKILLBOSS_API_KEY），其用量与调用第三方 STT API 成正比。该 key 用于访问外部服务并可能产生费用/账单；不会索取任何无关凭据。

✓ 持久化与权限

该技能未标记 always:true，且使用默认调用设置。它不要求系统级配置，也不修改其他技能。未请求提升持久性。

安全有层次，运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/21

- 首次发布基于 SkillBoss API Hub 的语音转文字功能，由 Whisper 等模型驱动。 - 支持音频文件转录及音频翻译为英文。 - 无需本地模型下载，API 自动选择最佳模型。 - 需设置 SKILLBOSS_API_KEY 环境变量。 - 附带简易 Python 示例，便于快速上手。

● 无害

安装命令

点击复制

官方npx clawhub@latest install martin-transcribe

镜像加速npx clawhub@latest install martin-transcribe --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

调用 SkillBoss API Hub 的 /v1/pilot 接口，即可基于 OpenAI Whisper 及其他语音识别模型完成语音转文字（STT）。

快速开始（Python） ``python import requests, base64, os

SKILLBOSS_API_KEY = os.environ["SKILLBOSS_API_KEY"] API_BASE = "https://api.skillbossai.com/v1"

def pilot(body: dict) -> dict: r = requests.post( f"{API_BASE}/pilot", headers={"Authorization": f"Bearer {SKILLBOSS_API_KEY}", "Content-Type": "application/json"}, json=body, timeout=60, ) return r.json()

# 转录音频文件 audio_b64 = base64.b64encode(open("/path/audio.mp3", "rb").read()).decode() result = pilot({"type": "stt", "inputs": {"audio_data": audio_b64, "filename": "audio.mp3"}}) text = result["result"]["text"] print(text)

# 将音频翻译为英文 result = pilot({"type": "stt", "inputs": {"audio_data": audio_b64, "filename": "audio.m4a", "task": "translate"}}) text = result["result"]["text"] print(text)`

注意事项

无需本地下载模型；SkillBoss API Hub 自动路由至最优 STT 模型。

需设置环境变量 SKILLBOSS_API_KEY。

返回文本位于 result["result"]["text"]`。

运行时依赖

版本

安装命令

技能文档

相关技能推荐