Audio Transcription
v1.0.0Transcreve arquivos de áudio para texto usando Whisper local ou API. Use quando o usuário solicitar transcrição de áudios, mensagens de voz, ou 转换器 fala em texto. Suporta 格式化os OGG, MP3, WAV, M4A e outros via conversão automática.
运行时依赖
安装命令
点击复制技能文档
Audio Transcription
Transcreve arquivos de áudio para texto.
Recursos Transcrição de áudios em português e outros idiomas Suporte a múltiplos 格式化os (OGG, MP3, WAV, M4A, etc.) Conversão automática de 格式化os se necessário Detecção automática de idioma Como Usar Pré-requisitos
A 技能 tenta usar as se图形界面ntes ferramentas na ordem:
whisper (OpenAI Whisper via pip) whisper.cpp se instalado em ~/whisper.cpp API OpenAI (requer OPENAI_API_KEY) Script de Transcrição
Use o script scripts/transcribe.sh:
scripts/transcribe.sh [idioma]
Exemplo:
scripts/transcribe.sh /path/to/audio.ogg pt
Parâmetros arquivo_audio: Caminho para o arquivo de áudio idioma (opcional): Código do idioma (pt, en, es, etc.). Padrão: auto-检测 Instalação de Dependências
Se nenhuma ferramenta estiver disponível, a 技能 pode instalar whisper:
pip 安装 openAI-whisper
Para whisper.cpp local:
git clone https://github.com/ggerganov/whisper.cpp.git ~/whisper.cpp cd ~/whisper.cpp make
NOTAS O 格式化o OGG (Opus) do Telegram requer ffmpeg para conversão A transcrição pode levar alguns segundos dependendo do tamanho do áudio Qualidade da transcrição depende do 模型o Whisper usado