MiniMax Multimodal (Speech + Image)

Name: MiniMax Multimodal (Speech + Image)
Rating: 1

MiniMax 多模态技能 — 接入 MiniMax 令牌 Plan 接口，语音合成（TTS/音色克隆/音色设计）和图片生成（文生图/图生图）。使用 speech-2.8-hd（语音）和 image-01（图像）模型，消费令牌 Plan 额度。当用户提到语音合成、音色克隆、图片生成、文生图、图生图、 MiniMax 令牌 Plan 时触发。

1· 213·0 当前·0 累计

by @percivalee·MIT-0

安全加密图像处理

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install minimax-speech-image

镜像加速npx clawhub@latest install minimax-speech-image --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

MiniMax 多模态技能（令牌 Plan 版）

使用 MiniMax 令牌 Plan 额度进行语音合成和图片生成。

环境配置 MINIMAX_API_KEY: MiniMax API 密钥（必填，从令牌 Plan 页面获取） MINIMAX_REGION: cn 国内 / int 国际（默认 cn）语音模块同步 TTS python3 scripts/speech.py tts "欢迎使用" -v female-tianmei -o hello.mp3

参数：

text: 要转换的文本 voice_id: 音色 ID（见下方内置音色表）输出_file: 输出路径模型: 模型，默认 speech-2.8-hd 格式化: 音频格式，默认 mp3 sample_rate: 采样率，默认 32000 bitrate: 比特率，默认 128000 异步 TTS python3 scripts/speech.py tts-a同步 "长文本内容" -v female-tianmei # 返回 task_id，再用查询命令查询 python3 scripts/speech.py 查询

音色克隆 python3 scripts/speech.py clone <音频文件路径> -t "我的音色"

内部自动完成两步：1) 上传音频到 /v1/files；2) 调用 /v1/voice_clone 复刻音色。模型：speech-2.0-turbo（默认）。克隆后返回 voice_id，可用于 TTS。

音色设计 python3 scripts/speech.py de签名 "年轻女性，活泼开朗" -s custom

音色管理 python3 scripts/speech.py 列出 # 列出可用音色 python3 scripts/speech.py 删除 # 删除音色

内置音色 voice_id 描述 female-tianmei 女声甜美 male-yunyang 男声播音 female-badu 女声巴度图片模块文生图 python3 scripts/image.py 生成 "日出海边风景" -o sun设置.png -r 16:9

参数：

prompt: 图片描述输出_file: 输出路径（必填） aspect_ratio: 宽高比，1:1 / 16:9 / 9:16 / 4:3 / 3:4（默认 1:1）响应_格式化: 返回格式，url（默认）或 base64 图生图（编辑） python3 scripts/image.py edit "把猫变成老虎" -i cat.png -o tiger.png -r 1:1

支持本地文件路径或 URL。

Python 函数调用语音 from scripts.speech 导入 text_to_speech, clone_voice, de签名_voice, 列出_voices

# TTS text_to_speech("你好世界", voice_id="female-tianmei", 输出_file="hello.mp3")

# 音色克隆 voice_id = clone_voice("my_voice.mp3", title="我的音色")

# 音色设计 voice_id = de签名_voice("年轻男性，沉稳专业", style="custom")

# 音色列表 voices = 列出_voices()

图片 from scripts.image 导入生成_image, 生成_image_from_image, 下载_image

# 文生图生成_image("日出海边", 输出_path="sun设置.png", aspect_ratio="16:9")

# 图生图生成_image_from_image("添加中国风元素", image_file="photo.png", 输出_path="结果.png")

# 下载图片下载_image("https://example.com/image.png", "local.png")

License

运行时依赖

安装命令

技能文档

相关技能推荐