📦 英语导师
v1.0.0英语口语陪练助手,支持语音对话纠错。当用户想练口语、语音交互、纠正英文错误,或按艾宾浩斯遗忘曲线复习单词时触发。
运行时依赖
版本
English Tutor 1.0.0 — 初始发布 - 新增本地与在线 ASR(automatic speech recognition)配置指南,含模型下载与校验脚本。 - 引入 TTS(text to speech)选项,支持 piper、espeak-ng、gTTS 及多家在线服务,附详细环境变量说明。 - 提供英语口语练习与纠错流程,每条回复附带中文解释。 - 内置基于艾宾浩斯的词汇复习系统。 - 新增环境检查、模型下载与转录脚本。
安装命令
点击复制技能文档
English Tutor · 英语口语陪练
功能概览
- 语音输入 → ASR 转写为文字(本地或线上方案)
- 口语纠错 → 指出英语表达错误,给出正确说法
- 语音回复 → TTS 合成语音,飞书显示为原生语音卡片
- 中文解释 → 每次回复附带中文说明
- 艾宾浩斯复习 → 单词记忆与周期复习
---
第一步:环境检测
``bash
python3 scripts/check_env.py
`
按提示修复缺失项后继续。 ---
ASR 方案选择
ASR 负责把用户语音转成文字。选择一种: 方案 A:本地 ASR(推荐,零外部依赖)
使用 sherpa-onnx SenseVoice 模型,已内置于技能中。
模型路径: SENSE_VOICE_MODEL_DIR 环境变量(默认 ~/.local/share/sense-voice-model/)
若无模型,运行:
`bash
# 默认下载到 ~/.local/share/sense-voice-model/
bash scripts/download_model.sh
# 自定义路径:
export SENSE_VOICE_MODEL_DIR=/your/custom/path
SENSE_VOICE_MODEL_DIR=/your/custom/path bash scripts/download_model.sh
`
安装依赖:
`bash
pip install --user --break-system-packages numpy sherpa-onnx
`
验证:
`bash
python3 scripts/transcribe.py /path/to/test.ogg # 输出文字则成功
` 方案 B:线上 ASR API
`env
ASR_PROVIDER=assemblyai # 或 openai、xfyun
ASR_API_KEY=your-key
`
| 服务 | 免费额度 | 注册地址 |
|------|---------|---------|
| AssemblyAI | 5小时/月 | assemblyai.com |
| OpenAI Whisper | $5额度 | platform.openai.com | ---
TTS 方案选择
TTS 负责把文字回复转为语音。选择一种: 方案 A:本地 TTS(零成本)
##### A1:piper(推荐,高质量,需额外下载)
piper 音质最好,需下载主程序 + ONNX Runtime + 语音模型(约150MB)。
下载 piper 主程序(Linux x86_64):
`bash
curl -L https://github.com/rhasspy/piper/releases/download/v1.2.0/piper_amd64.tar.gz -o /tmp/piper_amd64.tar.gz
tar xf /tmp/piper_amd64.tar.gz -C /tmp
/tmp/piper/piper_phonemize --version # 验证
`
下载英语语音模型(20~50MB):
`bash
curl -L "https://huggingface.co/rhasspy/piper-voices/resolve/main/en/en_US/medium/en_US_medium.onnx.tar.gz" -o /tmp/en_US_medium.tar.gz
tar xf /tmp/en_US_medium.tar.gz -C /tmp
`
配置:
`env
TTS_PROVIDER=piper
PIPER_BIN=/tmp/piper/piper_phonemize
PIPER_MODEL=/tmp/en_US_medium.onnx
`
##### A2:espeak-ng(需 root)
`bash
sudo apt-get install espeak-ng
espeak-ng --version
espeak-ng "Hello world" -w output.wav
`
`env
TTS_PROVIDER=espeak
ESPEAK_VOICE=en-us
`
##### A3:gTTS(Python 库,无需 API Key)
`bash
pip install gTTS
`
`env
TTS_PROVIDER=gtts
`
⚠️ 国内需代理或改用其他方案。 方案 B:线上 TTS API
##### B1:MiniMax TTS(音质最好,已配置)
`env
TTS_PROVIDER=minimax
MINIMAX_API_KEY=sk-your-key
MINIMAX_TTS_MODEL=speech-2.8-hd
MINIMAX_TTS_VOICE_ID=male-qn-qingse
MINIMAX_TTS_SPEED=1.05
`
推荐音色:
| 用途 | voice_id |
|------|---------|
| 男声 | male-qn-qingse |
| 女声 | female-tianmei |
| 英式男声 | English_Trustworthy_Man |
| 英式女声 | English_Graceful_Lady |
##### B2:OpenAI TTS
`env
TTS_PROVIDER=openai
OPENAI_API_KEY=sk-your-key
OPENAI_TTS_MODEL=tts-1
OPENAI_TTS_VOICE=alloy
`
##### B3:Azure TTS
`env
TTS_PROVIDER=azure
AZURE_SPEECH_KEY=your-key
AZURE_SPEECH_REGION=eastus
``
---
LLM 配置
默认使用 OpenClaw 主会话的 LLM,无需额外配置。---