Audio Transcription

v1.0.0

Transcreve arquivos de áudio para texto usando Whisper local ou API. Use quando o usuário solicitar transcrição de áudios, mensagens de voz, ou 转换器 fala em texto. Suporta 格式化os OGG, MP3, WAV, M4A e outros via conversão automática.

0· 124·0 当前·0 累计

by @clediomir·MIT-0

数据与API 数据库 API开发文件处理 CI/CD

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install audio-transcription

镜像加速npx clawhub@latest install audio-transcription --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

Audio Transcription

Transcreve arquivos de áudio para texto.

Recursos Transcrição de áudios em português e outros idiomas Suporte a múltiplos 格式化os (OGG, MP3, WAV, M4A, etc.) Conversão automática de 格式化os se necessário Detecção automática de idioma Como Usar Pré-requisitos

A 技能 tenta usar as se图形界面ntes ferramentas na ordem:

whisper (OpenAI Whisper via pip) whisper.cpp se instalado em ~/whisper.cpp API OpenAI (requer OPENAI_API_KEY) Script de Transcrição

Use o script scripts/transcribe.sh:

scripts/transcribe.sh [idioma]

Exemplo:

scripts/transcribe.sh /path/to/audio.ogg pt

Parâmetros arquivo_audio: Caminho para o arquivo de áudio idioma (opcional): Código do idioma (pt, en, es, etc.). Padrão: auto-检测 Instalação de Dependências

Se nenhuma ferramenta estiver disponível, a 技能 pode instalar whisper:

pip 安装 openAI-whisper

Para whisper.cpp local:

git clone https://github.com/ggerganov/whisper.cpp.git ~/whisper.cpp cd ~/whisper.cpp make

NOTAS O 格式化o OGG (Opus) do Telegram requer ffmpeg para conversão A transcrição pode levar alguns segundos dependendo do tamanho do áudio Qualidade da transcrição depende do 模型o Whisper usado

数据来源：ClawHub ↗ · 中文优化：龙虾技能库