🎛️ MiniMax — 多模态 API 工具(文本、语音、视频、音乐)
v1.0.0MiniMax 是一款多模态 API 工具,支持文本、语音、视频和音乐 API,通过模型路由、兼容 SDK 和更安全的多模态工作流。它帮助开发者安全地操作 MiniMax 相关工作流,包括模型路由、API 选择、语音生成、媒体作业队列、MCP 边界和生产环境下的重试模式。
1· 469·3 当前·3 累计
安全扫描
OpenClaw
安全
high confidence该技能的请求资源和运行指令与 MiniMax 多模态集成一致:需要 MiniMax API 密钥,在 ~/minimax/ 下持久化小型操作员状态,提供操作指南,无隐藏安装或无关凭据。
评估建议
["仅提供适当范围的 MINIMAX_API_KEY(使用专用密钥或可以旋转的工作空间账户)","预计技能将在 ~/minimax/ 下创建和读取小文件 - 确认您对该路径感到舒适,并且不会用于存储大型私人资产,除非您明确批准","技能承诺在私人媒体上传、语音克隆、启用远程 MCP 主机或启动付费/长时间运行作业之前要求明确批准 - 验证代理实际在这些流程中提示您同意","在生产环境中使用之前,审查 MiniMax 提供商文档和任何组织关于外部 API 密钥的政策。如果您想要更高的保证,请要求技能作者提供它将执行的确切 API 调用的最小示例(基本 URL 和请求形状),或先使用低权限测试密钥运行它"]...详细分析 ▾
✓ 用途与能力
名称/描述(MiniMax 多模态 API)与声明的要求匹配:单个 MINIMAX_API_KEY 和用于持久操作员状态的配置路径。请求的内容(无不相关的云凭据或额外二进制文件)与声明的平台集成目的成比例。
✓ 指令范围
SKILL.md 指示代理在 ~/minimax/ 下创建/读取/写入小型操作文件(内存、路由、默认值)并使用 MINIMAX_API_KEY。这些文件读/写在元数据中声明,与技能的声明行为一致。指令明确要求在上传私人媒体、语音克隆、启用远程 MCP 主机或启动付费作业之前获得用户批准。
✓ 安装机制
仅指令的技能,无安装规格和代码文件 — 最低风险的交付模型。无下载、提取步骤或外部安装 URL。
✓ 凭证需求
仅需要一个凭据(MINIMAX_API_KEY),它是声明的主要凭据。技能不请求无关的秘密或多个无关的环境变量。声明的配置路径 (~/minimax/) 与技能的声明持久存储需求一致。
✓ 持久化与权限
技能不是始终运行的,不请求提升的平台权限。它在用户范围的目录下保留自己的小型操作文件(在获得明确同意后,根据 setup.md)。默认允许自主模型调用,这对于技能来说是正常的,并且本身不是一个问题。
安全有层次,运行前请审查代码。
运行时依赖
🖥️ OSLinux · macOS · Windows
版本
latestv1.0.02026/3/13
初始发布,包含模型路由、文本兼容性指导、语音和媒体工作流、MCP 边界和故障恢复。
● 无害
安装命令
点击复制官方npx clawhub@latest install minimax
镜像加速npx clawhub@latest install minimax --registry https://cn.longxiaskill.com
技能文档
适用场景
用户希望将 MiniMax 作为真正的多模态平台使用,而不是模糊的品牌提及。代理处理模型路由、API选择、兼容SDK注意事项、语音生成、排队媒体作业、MCP边界和生产安全重试模式。
当阻碍是操作性问题时使用此技能:错误的界面、错误的模型层级、被忽略的参数、中断的轮询循环、不安全的媒体上传,或跨文本、语音、视频和音乐任务的不良路由。
架构
记忆存储在 ~/minimax/ 中。如果 ~/minimax/ 不存在,请运行 setup.md。结构请参见 memory-template.md。
~/minimax/
|-- memory.md # 持久上下文、激活边界和已批准的默认值
|-- routing.md # 实际有效的模型和界面选择
|-- text-defaults.md # 文本模型固定、SDK兼容性注释和解析规则
|-- speech-defaults.md # 语音、格式、延迟和同意敏感的语音注释
|-- media-jobs.md # 异步视频或音乐作业模式、轮询和输出处理
|-- mcp-notes.md # 已批准的MCP主机、范围和拒绝原因
-- incidents.md # 速率限制、失败作业、不良提示和恢复注释
快速参考
仅加载当前阻碍所需的文件。
| 主题 | 文件 |
|---|---|
| 设置指南 | setup.md |
| 记忆模板 | memory-template.md |
| 模型选择和路由 | model-routing.md |
| 原生、Anthropic兼容和OpenAI兼容的文本流程 | text-interfaces.md |
| 语音生成和音频交付 | speech-workflows.md |
| 视频、音乐和异步媒体作业 | media-generation.md |
| MCP边界和编排选择 | mcp-and-orchestration.md |
| 故障恢复和调试 | troubleshooting.md |
要求
MINIMAX_API_KEY用于直接使用 MiniMax API。- 选择的客户端界面:原始HTTP、已批准的SDK,或现有的Anthropic兼容或OpenAI兼容集成。
- 在上传私人媒体、克隆或模仿真实人物的声音、启用远程MCP服务器或启动长时间运行的付费生成作业之前,需要明确的用户批准。
- 当任务依赖精确的产品界面时,必须根据官方MiniMax文档验证当前模型名称、兼容性限制和端点行为。
操作覆盖范围
此技能将MiniMax视为执行平台,而不是单行提供商交换。它涵盖:
通过原生MiniMax API和兼容SDK界面进行文本生成在当前文本系列(如MiniMax-M2.5、MiniMax-M2.5-highspeed、MiniMax-M2.1、MiniMax-M2.1-highspeed和MiniMax-M2)之间进行模型路由- 使用同步HTTP和低延迟端点选择进行语音生成
- 视频和音乐的排队媒体工作流,其中提交、轮询和获取是独立阶段
- MCP感知工作流,其中工具访问、主机信任和数据范围必须明确
- 围绕被忽略的参数、格式错误的有效载荷、长队列时间、速率限制和输出可重复性进行调试
数据存储
仅在 ~/minimax/ 中保留持久的MiniMax操作上下文:
用户实际使用的模态:文本、语音、视频、音乐或MCP支持的流程- 已批准的模型、速度层级和在实际任务中有效的兼容性界面
- 输出默认值,如JSON解析规则、音频格式、轮询间隔和重试策略
- 用户明确批准的媒体安全规则、同意要求和预算边界
- 重复失败,如401错误、被忽略的参数、队列停滞或不良提示模板
核心规则
1. 首先锁定模态和交付物
- 首先命名实际输出:结构化文本、聊天回复、旁白音频、短视频、歌曲草稿或工具增强工作流。
- MiniMax不是单一界面。错误的模态选择会导致错误的端点、错误的延迟预期和错误的重试逻辑。
2. 谨慎选择原生与兼容API
- 当您需要MiniMax特定功能或精确行为时,使用原生MiniMax API。
- 仅当周围应用已经依赖这些SDK且支持的子集足够好时,才使用Anthropic兼容或OpenAI兼容界面。
- 将兼容性层视为更窄的界面,而不是功能完整的副本。
3. 固定确切的模型系列和速度层级
- 明确选择质量优先、速度优先或备用模型,而不是说"使用MiniMax"。
当前文本路由应从MiniMax-M2.5或MiniMax-M2.5-highspeed开始,仅在延迟、成本或兼容性需要时才降级。- 在交付硬编码模型列表之前重新检查实时文档,因为MiniMax经常更新其公共界面。
4. 分离同步与异步媒体工作
- 同步文本和语音流程通常可以在一个请求中返回。
- 视频和音乐生成通常需要提交、轮询、超时和获取逻辑。
- 不要为本质上排队的媒体作业设计阻塞式一次性工作流。
5. 在生成前验证媒体权利、输入和格式
- 确认用户有权上传或转换任何语音、歌词、参考媒体或品牌资产。
- 在生成前验证格式、时长、语言和输出预期。
- 不良资产假设比不良提示更快地浪费支出。
6. 明确成本和信任边界
- 多模态运行可以将提示、媒体和元数据发送到机器外,并且成本会快速累积。
- 说明哪个端点将接收哪个有效载荷,并在远程MCP或大型媒体上传之前停止,除非用户批准了该路径。
- 不要仅仅因为API支持就将远程执行视为正常。
7. 以可重现的配方结束
- 成功的MiniMax运行以精确的模型、界面、关键参数、资产输入和轮询行为结束,记录足够清晰以便重新运行。
- 如果输出很脆弱,请在再次更改提示或模型之前捕获最窄的可重现有效载荷。
MiniMax陷阱
- 将每个MiniMax功能视为可通过每个SDK垫片使用 -> 参数被忽略,调试从错误的前提开始。
- 说"使用MiniMax模型"而不固定系列或速度层级 -> 延迟、质量和成本在运行之间漂移。
- 将媒体流构建为一个请求和一个响应 -> 排队作业挂起或失败,没有可用的恢复。
- 在澄清权利或同意之前上传敏感媒体 -> 技术工作流成功但使用不安全。
- 假设文本默认值适用于语音、视频或音乐 -> 提示、有效载荷形状和验证规则很快偏离。
- 在检查有效载荷模式、队列状态或输出获取逻辑之前指责模型 -> 操作bug被错误标记为生成质量问题。
- 让MCP服务器在没有主机审查的情况下接触广泛数据 -> 工具便利性变成信任漏洞。
外部端点
除非用户明确批准更多,否则仅允许这些端点类别:
端点 发送数据 目的 https://api.minimax.io 提示、已批准的媒体输入、生成参数和轮询请求 原生MiniMax文本、语音、媒体和相关API工作流 https://api-uw.minimax.io 已批准的语音有效载荷和生成参数 当用户想要更快的首个音频时,可选的低TTFA语音端点 https://platform.minimax.io/docs 仅文档查询 验证当前模型、兼容性注释和API行为 https://{user-approved-mcp-host} 已批准的MCP服务器所需的请求有效载荷 本地机器之外的可选MCP工具访问
除非用户明确批准额外的主机或提供商路由,否则不会向外部发送其他数据。安全与隐私
离开您机器的数据:
- 发送到MiniMax API端点的提示和参数
- 仅为用户请求的生成工作流发送已批准的媒体资产或参考文件
- 仅为用户批准的MCP主机发送可选的MCP有效载荷
- 可选地查阅官方MiniMax文档
保留在本地的数据:
~/minimax/下的持久操作注释- 本地提示草稿、路由选择和事件注释,除非用户导出它们
- 任何从未上传的被拒绝或未使用的资产
此技能不会:
在没有验证的情况下将兼容SDK视为精确的功能匹配- 在没有明确用户意图的情况下上传私人媒体、语音参考或歌词
- 在没有明确批准的情况下启用远程MCP或广泛的工具访问
- 声称每个MiniMax模态都是同步的或立即可用的
- 修改其自己的技能文件
信任
通过使用此技能,提示和已批准的媒体可能会发送到MiniMax服务以及任何可选的用户批准的MCP主机。
只有在您信任这些服务处理这些数据时才安装。
范围
此技能仅:
帮助安全地操作MiniMax文本、语音、视频、音乐和MCP相关工作流- 将任务路由到正确的模型系列、界面和作业模式
- 保留已批准默认值、预算边界和重复失败的持久注释
此技能从不:
在不检查界面限制的情况下将MiniMax视为通用提供商替代品- 在没有权利和同意检查的情况下建议语音模仿或媒体转换
- 模糊本地编排和远程MCP执行之间的界限
- 承诺排队的媒体作业表现得像低延迟文本调用
相关技能
如果用户确认,请使用 clawhub install 安装:
- ai
- 在锁定堆栈之前将MiniMax与其他模型提供商进行比较。 api- 在MiniMax API周围重用结构化HTTP、重试和有效载荷调试模式。models- 为质量、延迟和成本选择正确的模型系列和备用链。video-generation- 将MiniMax视频工作扩展到更广泛的多提供商视频路由。music- 当任务特别以音乐为先时,加强提示和编排决策。
反馈
如果有用:clawhub star minimax保持更新:clawhub sync`