Whisper Stt

v0.1.0

语音转文字 - 使用OpenAI Whisper将音频文件识别为文字

0· 592·0 当前·0 累计

by @qiaotucodes (魏然)·MIT-0

AI模型访问

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install openclaw-skill-whisper-stt

镜像加速npx clawhub@latest install openclaw-skill-whisper-stt --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

Whisper 语音转文字技能

将音频/语音文件识别并转换为文字。

使用方式自动处理（推荐）

当用户发送语音/音频文件时，自动：

识别语音内容转换为文字发送文字到飞书手动命令

用户发送音频文件后，技能自动处理。

支持格式 MP3, WAV, M4A, OGG, FLAC, 网页M 任何音频格式（FFmpeg支持即可）模型选择模型大小速度精度 tiny ~1GB 最快基础 base ~1GB 快一般 small ~2GB 中等较好 medium ~5GB 较慢很好 large ~10GB 最慢最佳 turbo ~6GB 快接近large 技术实现导入 whisper

# 加载模型（首次使用会下载）模型 = whisper.load_模型("base") # 可选: tiny/base/small/medium/large/turbo

# 识别语音结果 = 模型.transcribe("audio.mp3")

# 输出文字 print(结果["text"])

依赖 Python 3.8+ PyTorch openAI-whisper ffmpeg 注意事项首次使用会下载模型（1-10GB）大模型需要较多内存中文识别效果很好

License

运行时依赖

安装命令

技能文档

相关技能推荐