标签: 音频处理
midasheng-audio-generate — 基于文本的沉浸式音频场景生成v1.1.5 安全
通过文本描述生成包含语音、音效、音乐和环境声音的沉浸式音频场景。由小米和上海交通大学开发,支持多语言输入,输出WAV格式音频。
3 161 1音频处理AI模型访问开发工具API工具MIT-0
macos-audio — macOS 音频和蓝牙设备管理v1.0.0 可疑
通过 macos-audio 命令行界面(CLI)管理 macOS 的音频输出和蓝牙设备。适用于扫描已配对设备、连接/断开蓝牙、切换音频输出等场景。
0 272 1音频处理系统工具操作系统MIT-0
Ressemble TTS e STT — Ressemble TTS & STT — 文本转语音与语音转文本集成v1.0.1 可疑
利用 Resemble AI HTTP API 实现文本转语音(TTS)和语音转文本(STT)的集成,支持异步转录和高质量语音合成。
0 496 0音频处理AI模型访问开发工具API工具MIT-0
BibiGPT Skill — 视频、音频和播客终端摘要工具v?
BibiGPT 命令行工具,用于直接在终端中对视频、音频和播客进行摘要。支持从 YouTube、Bilibili、播客等 URL 地址进行摘要。
2 1000 0视频处理音频处理自动化开发工具
Doubao Podcast TTS — 抖宝播客文本转语音v?
利用抖宝/字节跳动播客 TTS API 生成音频,解析 WebSocket 二进制帧,处理流式音频块,提取 audio_url 等,适用于播客内容的自动语音化处理。
0 65 0API工具音频处理AI模型访问
Partykeys Midi — 通过 WebSocket 控制 PartyKeys MIDI 键盘v?
通过 WebSocket 连接 PartyKeys MIDI 键盘,支持 12 色键盘灯光控制、实时监听播放、播放序列以及音乐跟随模式等功能,适用于音乐制作和演出场景。
0 134 0音频处理网络工具自动化
🔊 minimax-tts — 高质量文本转语音合成v1.0.0 安全
利用 MiniMax speech-2.8-hd 模型进行高质量文本转语音合成,支持多种中文和英文声音。按需安装。
0 233 0音频处理AI模型访问开发工具MIT-0
🎙️ Free Audio Editor — 免费音频编辑器v1.0.0 可疑
使用此免费音频编辑器技能,编辑音频文件(支持 MP3、WAV、AAC、M4A,最大 200MB),通过云端 AI 处理生成清晰的音频视频。适合播客主、内容创作者、学生等,支持背景噪声去除、静音修剪、音量归一化等功能,处理时间仅 30-60 秒,输出 1080p MP4 文件。
0 24 0音频处理云服务AI模型访问MIT-0
🎧 Easy Audio Editor — 云端音频编辑器v1.0.0 可疑
云端音频编辑工具,支持清理和修剪音频轨道,适用于视频项目。支持上传 MP3、WAV、AAC、M4A 文件(最多 200MB),描述编辑需求,30-60 秒内输出 1080p MP4 视频。面向播客制作人、内容创作者、学生等。
0 42 0音频处理云服务视频处理开发工具API工具MIT-0
Best Audio Editor — AI音频编辑器v1.0.0 安全
使用此AI音频编辑器技能,编辑音频文件为清洁的音频轨道。支持MP3、WAV、AAC、MP4格式,文件大小可达500MB。适合播客主、YouTuber和内容创作者。
0 27 0音频处理AI模型访问云服务内容创作MIT-0
AIOZ Stream Skill — AIOZ 分布式流媒体管理v1.0.2 安全
通过 AIOZ Stream API,管理视频、音频、播放列表、播放器、Webhook、分析、支付、章节和字幕。支持分布式流媒体平台的各种操作,包括媒体上传、元数据管理、播放器自定义、分析查询等。
0 172 0视频处理音频处理开发工具API工具自动化文件处理MIT-0
Polymarket Music Entertainment Trader — Polymarket 音乐娱乐交易者 — 交易音乐流行指标、专辑排行、格莱美奖、巡演收入等v1.0.3 安全
该技能利用 Simmer SDK 和单一 API 键在 Polymarket 平台上交易音乐娱乐相关预测市场,包括音乐流行指标、专辑排行、格莱美奖、巡演收入、音乐行业交易等。默认为纸牌交易,仅在明确运行 `--live` 时执行真实交易。
0 245 0API工具自动化音频处理金融科技MIT-0
Qwen3-TTS VoiceDesign — 自然语言文本到语音,自定义语音设计v1.0.0 安全
Qwen3-TTS VoiceDesign 实现文本到语音的功能,允许通过自然语言描述和基于种子(seed)的音调固定设计自定义语音。包含 OpenAI 兼容的 API 服务器、一键式设置和批量种子探索工具,适用于语音生成、语音设计和集成到 OpenClaw。
0 521 0音频处理AI模型访问开发工具API工具MIT-0
🤖 SAM TTS — 经典复古机器人语音合成v1.0.0 安全
使用经典的 C64 文本转语音合成器 SAM,生成复古机器人语音音频。支持通过 `/sam` 命令生成语音消息,包括开关模式、语音参数定制(音调、速度、口腔、喉部)等功能。
2 775 0音频处理语音合成开发工具MIT-0
Audio Editor — 音频编辑器v?
使用自然语言命令执行音频编辑任务,包括剪裁、音量调整、格式转换和从视频文件中提取音频。
0 803 0音频处理开发工具自动化
inSaiAI Intelligent Editing — inSaiAI 智能编辑 — 多媒体处理v?
用于视频/音频处理任务,包括转码、过滤、流媒体、元数据操作和使用 FFmpeg 的复杂滤波器图操作。
0 1100 0视频处理音频处理API工具命令行工具
Audio — 音频处理v?
处理、增强和转换音频文件,支持噪音去除、归一化、格式转换、转录和播客工作流。
2 1300 0音频处理API工具自动化
MLX Audio Server — 本地AI语音服务器v?
MLX Audio Server 是一个运行在 Mac 上的本地 24x7 开放 AI 兼容 API 服务器,支持语音转文本(STT)和文本转语音(TTS),由 MLX 驱动。
0 2500 0音频处理AI模型访问开发工具容器与虚拟化
Audio Reply — 文本转语音回复v?
使用文本转语音(TTS)生成音频回复。通过“读给我听 [公共 URL]”来获取并朗读内容,或使用“跟我聊 [主题]”来生成口语回复。
4 2500 0音频处理AI模型访问
Transcribe audio files via OpenRouter using audio-capable models — OpenRouter 音频转文本 — 使用音频模型转录音频文件v?
利用 OpenRouter 和音频模型(如 Gemini、GPT-4o-audio 等)转录音频文件,实现高效的音频转文本功能,适用于各种音频处理需求。
3 3300 0音频处理AI模型访问API工具
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制