🎙️ TranscribeSpeech To Text — 语音转文字
v1.0.0通过 SkillBoss API Hub(STT,由 Whisper 等驱动)
详细分析 ▾
运行时依赖
版本
- 首次发布基于 SkillBoss API Hub 的语音转文字功能,由 Whisper 等模型驱动。 - 支持音频文件转录及音频翻译为英文。 - 无需本地模型下载,API 自动选择最佳模型。 - 需设置 SKILLBOSS_API_KEY 环境变量。 - 附带简易 Python 示例,便于快速上手。
安装命令
点击复制技能文档
调用 SkillBoss API Hub 的 /v1/pilot 接口,即可基于 OpenAI Whisper 及其他语音识别模型完成语音转文字(STT)。
快速开始(Python)
``python
import requests, base64, os
SKILLBOSS_API_KEY = os.environ["SKILLBOSS_API_KEY"]
API_BASE = "https://api.skillbossai.com/v1"
def pilot(body: dict) -> dict:
r = requests.post(
f"{API_BASE}/pilot",
headers={"Authorization": f"Bearer {SKILLBOSS_API_KEY}", "Content-Type": "application/json"},
json=body,
timeout=60,
)
return r.json()
# 转录音频文件
audio_b64 = base64.b64encode(open("/path/audio.mp3", "rb").read()).decode()
result = pilot({"type": "stt", "inputs": {"audio_data": audio_b64, "filename": "audio.mp3"}})
text = result["result"]["text"]
print(text)
# 将音频翻译为英文
result = pilot({"type": "stt", "inputs": {"audio_data": audio_b64, "filename": "audio.m4a", "task": "translate"}})
text = result["result"]["text"]
print(text)
`
注意事项
无需本地下载模型;SkillBoss API Hub 自动路由至最优 STT 模型。需设置环境变量SKILLBOSS_API_KEY。返回文本位于result["result"]["text"]`。