Xiaomi MiMo TTS

Name: Xiaomi MiMo TTS
Rating: 1

使用小米 MiMo TTS (mimo-v2-tts) 生成语音。支持多种音色、风格控制、情感标签和方言。需要 MIMO_API_KEY。

1· 656·0 当前·0 累计

by @jazzqi·MIT-0

API开发

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install xiaomi-mimo-tts

镜像加速npx clawhub@latest install xiaomi-mimo-tts --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

Xiaoma MiMo TTS 📁 目录结构 scripts/ ├── mimo-tts.sh # 基础版本统一入口 ├── mimo-tts-smart.sh # 智能版本统一入口 ├── base/ # 基础版本实现 │ ├── mimo-tts.sh # Shell 基础版 │ ├── mimo_tts.js # NodeJS 基础版 │ └── mimo_tts.py # Python 基础版 ├── smart/ # 智能版本实现 │ ├── mimo_tts_smart.js # NodeJS 智能版 │ ├── mimo_tts_smart.py # Python 智能版 │ └── mimo_tts_smart.sh # Shell 智能版 ├── utils/ # 工具脚本 │ └── test.sh # 测试脚本 └── examples/ # 示例脚本 └── demo.sh # 演示脚本

✨ 核心能力

根据对话场景，智能选择最合适的语音风格！

作为代理，你应该主动理解对话内容，选择合适的：

情感：开心、悲伤、紧张、愤怒、惊讶、温柔... 方言：东北话、四川话、台湾腔、粤语... 效果：悄悄话、夹子音、唱歌... 语速：快、慢、正常使用方式基础用法 ./scripts/mimo-tts.sh "文本" [输出文件]

带风格标签 # 在文本前加今天真是太棒了！" "老铁，咋整啊？" "这是秘密哦..."

可用风格类型示例情感开心、悲伤、紧张、愤怒、惊讶、温柔方言东北话、四川话、台湾腔、粤语、河南话效果悄悄话、夹子音、唱歌语速变快、变慢情感标签（细粒度控制）

在文本中使用 () 添加情感：

"（紧张，深呼吸）呼……冷静，冷静" "（咳嗽）咳咳，不好意思" "（沉默片刻）……然后呢？"

代理职责

你应该主动判断对话场景，选择合适的风格！

判断原则默认使用普通话，除非用户明显使用方言或有特别要求根据内容选择情感：好消息 → 开心坏消息/安慰 → 温柔、悲伤紧急情况 → 紧张、急促正式通知 → 严肃根据场景选择效果：私密内容 → 悄悄话朗读诗词 → 温柔、慢讲故事 → 根据角色变化示例

用户说："给我读首李白的诗" → 判断：诗词应温柔、舒缓 → 生成："床前明月光..."

用户说："用东北话给我讲个笑话" → 判断：明确要求方言 → 生成："那个啥..."

用户说："宝宝晚安" → 判断：亲密、温柔场景 → 生成："晚安，好梦哦～"

可用语音语音参数默认 mimo_default 中文女声 default_zh 英文女声 default_eh 智能模式（说明与使用建议）

本项目提供“智能模式”（位于 scripts/mimo-tts-smart.sh 与 scripts/smart/ 下），它使用轻量的启发式与关键词检测来自动为文本选择合适的风格、方言与情感。该模式设计用于快速试验与交互式体验，而非对每种语境都保证高精度。

建议与行为：

默认不在自动化流水线中启用智能模式。将其视为可选的便捷工具，需由代理或用户显式调用。若对输出准确性有较高要求，请在输入文本最前面使用明确指定风格与方言。智能模式适合快速原型、演示与人机协作场景；不适合替代人工细致调整或用于对准确性敏感的生产流程。

调用示例：

# 显式启用智能模式（代理或用户调用） ./scripts/mimo-tts-smart.sh "宝宝晚安，爱你哦～" 输出.ogg

# 若要手动覆盖智能判断，直接在文本前使用 style 标签 ./scripts/mimo-tts.sh "床前明月光..." out.ogg

使用方式基础用法 ./scripts/mimo-tts.sh "文本" [输出文件]

带风格标签 # 在文本前加今天真是太棒了！" "老铁，咋整啊？" "这是秘密哦..."

在文本中使用 () 添加情感：

"（紧张，深呼吸）呼……冷静，冷静" "（咳嗽）咳咳，不好意思" "（沉默片刻）……然后呢？"

代理职责

你应该主动判断对话场景，选择合适的风格！

用户说："给我读首李白的诗" → 判断：诗词应温柔、舒缓 → 生成："床前明月光..."

用户说："用东北话给我讲个笑话" → 判断：明确要求方言 → 生成："那个啥..."

用户说："宝宝晚安" → 判断：亲密、温柔场景 → 生成："晚安，好梦哦～"

可用语音语音参数默认 mimo_default 中文女声 default_zh 英文女声 default_eh 🤖 智能版本 (多语言支持)

我们提供了多种智能脚本实现，可以自动分析文本内容并选择合适的风格：

🎯 实现支持版本文件特点统一入口 mimo-tts-smart.sh 自动选择最佳实现，优先NodeJS→Python→Shell NodeJS 版 mimo_tts_smart.js 功能最完善，智能分析最准确 Python 版 mimo_tts_smart.py 功能完整，备用方案 Shell 版 mimo_tts_smart.sh 简化版，兼容性好功能特点

自动分析：

检测情感关键词（开心、悲伤、紧张、愤怒、惊讶、温柔）识别方言特征（东北话、四川话、台湾腔、粤语）判断特殊效果（悄悄话、夹子音、唱歌）检测诗词格式（多行短句自动识别）

License

运行时依赖

安装命令

技能文档

相关技能推荐