首页龙虾技能列表 › Smart Audio Analyzer — 智能音频分析器(转写、说话人识别、场景检测、结构化纪要)

Smart Audio Analyzer — 智能音频分析器(转写、说话人识别、场景检测、结构化纪要)

v1.2.1

一体化音频分析工具,支持音频转写、基于声纹的说话人识别、自动场景检测(会议、采访、培训、讲座等)和生成结构化会议纪要。支持AssemblyAI、Whisper和Gemini多引擎,具有跨录音会话的持久声纹匹配能力。

0· 287·1 当前·1 累计
by @jojowillwater (JoJowillwater)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/12
安全扫描
VirusTotal
可疑
查看报告
OpenClaw
安全
high confidence
该技能的代码和指令与其声明的目的相符(转写、说话人识别、场景检测和生成纪要),但需注意元数据报告中的错误和隐私权衡(默认上传音频到云端ASR,除非强制使用本地Whisper)。
评估建议
该技能似乎如其宣称般功能:转写音频、局部匹配说话人声纹、检测场景、产生结构化纪要。安装前,请注意两点:(1)注册元数据未列出实际所需的API密钥(ASSEMBLYAI_API_KEY / GEMINI_API_KEY / OPENAI_API_KEY),请与发布者确认元数据和环境变量。(2)默认会上传音频到第三方ASR/总结服务——如果数据敏感,请设置ASR_ENGINE=whisper并安装本地Whisper/ffmpeg或避免提供云API密钥。验证声纹存储位置(references/voice-db.json)并确保权限/备份策略符合您的隐私要求。额外预防措施:运行npm install前审查脚本,在沙盒环境或独立环境中首次运行,限制API密钥权限,仅在理解声纹更新机制后确认说话人身份。...
详细分析 ▾
用途与能力
技能名称和描述(转写、说话人识别、场景检测、结构化纪要)与包含的文件(scripts/analyze.js 和 scripts/voiceprint.py)以及声明的npm/Python依赖项一致。然而,报告顶部的注册元数据未列出任何必需的环境变量/凭据,而SKILL.md明确要求ASSEMBLYAI_API_KEY、GEMINI_API_KEY或OPENAI_API_KEY(env_any_of)。此元数据不匹配是一个不一致性,应该在信任自动安装之前解决。
指令范围
SKILL.md 指示代理运行 node analyze.js 处理传入的音频,读写 references/voice-profiles.md 和 references/voice-db.json,加载场景模板,并在用户确认后更新配置文件。代码确实读写了这些文件。它还上传音频到第三方ASR/总结服务(AssemblyAI/Gemini/OpenAI/OpenRouter),除非使用本地Whisper回退。这些行为都在声明的目的范围内,但它们有隐私影响(音频发送到外部主机)。引导片段还指示代理自动为音频文件调用脚本——对于处理技能这是预期的,但值得注意。
安装机制
没有奇怪的安装方式:SKILL.md 指示运行 'cd scripts && npm install',这与提供的 package.json 和 package-lock.json 匹配(assemblyai、dotenv、openai)。默认不需要从个人服务器下载。引用了一个可选的ONNX模型下载(github.com/wenet-e2e/wespeaker/releases)——这是一个知名的发布主机,但它是可选的,如果使用,将写入磁盘上的模型文件。
凭证需求
SKILL.md 需要一个ASSEMBLYAI_API_KEY、GEMINI_API_KEY或OPENAI_API_KEY,并可选地需要WESPEAKER_MODEL/ASR_ENGINE;代码读取ASSEMBLYAI_API_KEY、GEMINI_API_KEY、OPENAI_API_KEY、OPENAI_BASE_URL/OPENAI_API_KEY用于总结。之前显示的注册元数据未报告任何必需的环境变量或主要凭据——这不一致且令人担忧,因为技能在没有这些密钥的情况下将无法运行(并将上传音频)。另外,音频上传到云ASR是设计的内在部分;用户应该考虑是否舒适地将录音发送到外部服务。voiceprint.py 将声纹存储在本地(references/voice-db.json),这与SKILL.md中的隐私声明相符。
持久化与权限
该技能不请求 'always: true',不会修改其他技能。它在自己的工作空间中写入和更新文件(references/voice-profiles.md 和 references/voice-db.json)以保持说话人配置文件,这是此功能的预期行为。代理自主调用设置为默认(允许),但这里没有提升。
scripts/analyze.js:177
检测到Shell命令执行(child_process)。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.2.12026/3/16

v1.2.1:修复隐私声明(音频确实上传到云端ASR,声纹嵌入不上传),修复硬编码模型路径为相对路径

● 可疑

安装命令 点击复制

官方npx clawhub@latest install audio-analyzer
镜像加速npx clawhub@latest install audio-analyzer --registry https://cn.clawhub-mirror.com

技能文档

(由于原始内容过长且包含大量不需要翻译的代码块和命令行指令,以下仅提供简要的中文SKILL.md翻译,保留关键信息)

数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务