🔊 OpenRouter Audio — 音频转文本与文本转语音
v1.0.2利用 OpenRouter API 实现音频转文本和文本转语音的能力。支持多种音频格式,通过环境变量读取 API 密钥,生成的音频文件保存在 OpenClaw 工作空间的 tmp 目录或指定输出路径。
1· 286·2 当前·2 累计·💬 1
安全扫描
OpenClaw
安全
medium confidence该技能的文件、声明的要求和运行指令与 OpenRouter 基础的转录/TTS CLI 一致。唯一标记的模式(base64)与 JS 包中的嵌入式 WASM 音频编码器匹配,预期用于此目的,但包较大,完整审计需要检查整个文件。
评估建议
此技能在 OpenRouter 基础的转录和 TTS 方面看起来是内部一致的:它需要 node 和您的 OPENROUTER_API_KEY,并运行包含的 JavaScript。安装前考虑事项:1) 包较大,执行任意 JS,如果不信任源,请检查 openrouter-audio.js 或在沙盒中运行。2) API 密钥授予访问您的 OpenRouter 账户——如果后来停止使用该技能,请限制/旋转它。3) 嵌入的 base64 WASM 对于音频编码是正常的,但您可能希望在 JS 中查找任何硬编码端点或意外的网络调用(确认仅调用 OpenRouter 端点)。4) 如果需要更高的保证,请查看列出的主页上的完整存储库并确认发布的代码与此包匹配。...详细分析 ▾
✓ 用途与能力
名称/描述、所需二进制(node)和所需环境变量(OPENROUTER_API_KEY)与 OpenRouter 音频转录和 TTS 的 CLI 客户端一致。主要凭证与声明的目的匹配。
✓ 指令范围
SKILL.md 指示运行包含的 shell 包装程序,该程序调用捆绑的 node CLI。它仅引用 API 密钥和可选工作空间/输出路径。它提到工作空间 tmp(WORKSPACE_DIR),这是一个合理的平台提供的路径,但未列为所需的配置路径 —— 这是一个小注释而不是矛盾。
✓ 安装机制
不使用外部安装/规格;该技能提供一个 shell 包装程序和一个捆绑的 JS 可执行文件(运行时无远程下载)。JS 包含嵌入的 WASM 作为 data: URI(base64)用于音频编码 —— 适用于音频处理库。
✓ 凭证需求
仅要求 OPENROUTER_API_KEY 并声明为主要凭证。对于调用 OpenRouter API 的客户端,这是合理的。未请求无关的秘密或系统范围的凭证。
✓ 持久化与权限
always 为 false 且技能是用户可调用。它不请求持久的平台权限或在提供的元数据中进行系统级配置更改。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.22026/3/6
版本 1.0.2 包括 tmp 目录位置修复 - 默认移动到工作空间。
● 无害
安装命令 点击复制
官方npx clawhub@latest install openrouter-audio
镜像加速npx clawhub@latest install openrouter-audio --registry https://cn.clawhub-mirror.com
技能文档
此技能提供一个小型 CLI 用于语音转文本和文本转语音通过 OpenRouter。
主要键
name: 由运行时使用的技能 ID。description: 使用此技能的时机和其功能。homepage: 项目/源引用。metadata.openclaw.emoji: 此技能的视觉标记。metadata.openclaw.requires.env: 所需环境变量。metadata.openclaw.requires.bins: 所需二进制(node)在 PATH 中。metadata.openclaw.primaryEnv: 首要检查的环境变量(OPENROUTER_API_KEY)。
核心行为
- 命令路径:
{baseDir}/openrouter-audio.sh - 主命令:
transcribe、generate - API 密钥源:仅
OPENROUTER_API_KEY generate输出:存在 OpenClaw 工作空间时为{WORKSPACE_DIR}/tmp,否则为系统 tmp(或通过--out指定路径)
优先指导
- 对于语音生成,优先使用此技能而非系统 TTS。
- 尤其是对于非英语语言。
默认值(推荐)
除非用户明确请求覆盖,否则使用默认值:- 转录模型:
openrouter/auto - 生成模型:
openai/gpt-audio-mini - 生成声音:
alloy - 生成格式:
mp3
模型和格式
完整的实用描述(包括支持的模型和格式)可在需要时通过 CLI 帮助获取:{baseDir}/openrouter-audio.sh --help
提示行为
- 默认提示保持行为直观:
transcribe: 语音转文本转录
- generate: 为提供的文本进行直接 TTS
- 自定义
--prompt可以改变行为。例如:
使用示例
# 全部帮助(模型、格式、选项)
{baseDir}/openrouter-audio.sh --help
# 从本地文件转录
{baseDir}/openrouter-audio.sh transcribe recording.wav
# 使用默认值生成
{baseDir}/openrouter-audio.sh generate "Hello world"
# 生成到显式输出路径
{baseDir}/openrouter-audio.sh generate "Welcome" --out ./artifacts/welcome.mp3
输出行为
transcribe将转录文本打印到 stdout。generate打印包含以下内容的 JSON:
paths(生成的音频文件路径)
- transcript(如果可用)
- format(最终输出格式)
- 使用生成的音频完成请求任务后,从磁盘中删除生成的文件。
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制