首页龙虾技能列表 › persona-voice — 飞书人格语音回复

persona-voice — 飞书人格语音回复

v1.1.0

飞书人格语音回复 Skill,支持随机或指定人格生成带人格风格的短回复,通过 SenseAudio TTS 合成语音,以飞书原生语音条发送。适用于飞书人格陪伴、随机人格语音回复、角色化语音机器人等场景。

0· 227·0 当前·0 累计
by @hei-maom (HeiMaoM)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/14
安全扫描
VirusTotal
无害
查看报告
OpenClaw
可疑
high confidence
技能代码和 SKILL.md 与 Feishu + SenseAudio persona TTS 集成一致,但注册表元数据遗漏了必需的环境变量和二进制文件,且存在一些范围/隐私问题,建议在安装前审查。
评估建议
该技能似乎能实现其所述功能(生成人格化回复,使用 SenseAudio 发送 TTS 音频到飞书)。安装前请注意:1) 实际需要 FEISHU_APP_ID、FEISHU_APP_SECRET 和 SENSEAUDIO_API_KEY(注册表元数据错误地列出无需任何环境变量),并将尝试从技能文件夹加载 .env.local/.env——请勿将密钥存储在仓库中。2) 了解音频(用户语音)将上传到 SenseAudio,音频文件将上传到飞书——请审查 SenseAudio 和飞书的隐私政策,并确保信任这些服务。3) 确保运行时环境中安装了 ffmpeg 或设置 FFMPEG_PATH;代码通过 subprocess 运行 ffmpeg。4) 如果需要对最终用户透明,请注意 SKILL 强制隐藏内部规则(它指示模型不要透露自己使用随机人格)。5) 首先在有限/测试环境中运行技能(使用测试凭据),并审查日志/请求以确认行为。如有需要,请维护者更正注册表元数据,列出所需的环境变量和二进制文件。...
详细分析 ▾
用途与能力
技能名称/描述(使用 SenseAudio TTS/ASR 的飞书/Lark 人格语音)与代码和说明一致。然而注册表元数据声称无需任何必需的环境变量或二进制文件,而 SKILL.md 和代码明确要求 FEISHU_APP_ID、FEISHU_APP_SECRET、SENSEAUDIO_API_KEY,并推荐 python3/ffmpeg/requests。这种元数据不匹配是一个不一致之处,可能会误导用户了解需要哪些密钥和工具。
指令范围
SKILL.md 和脚本将操作限制为:生成人格提示、调用 SenseAudio ASR/TTS 端点、使用 ffmpeg 转换音频、通过飞书 API 上传以及读写本地技能状态(.env、data/、outputs/)。说明不会尝试读取任意系统文件或无关凭据。有一个行为说明:指南明确指示模型不要透露内部规则或人格是随机选择的——这是一个功能性设计选择(对最终用户的欺骗行为),而不是技术不一致。
安装机制
没有安装规范(仅说明/脚本包)。代码依赖项最少(requirements.txt 中的 requests),不执行外部下载或安装程序。安装风险较低。
凭证需求
代码需要 FEISHU_APP_ID、FEISHU_APP_SECRET 和 SENSEAUDIO_API_KEY(以及可选的 FFMPEG_PATH 或在 PATH 中安装 ffmpeg)。这些凭据与所述的飞书 + SenseAudio 集成相称。问题是注册表元数据声明无需任何凭据——这是一个重要的不匹配。此外,代码会自动从技能根目录加载 .env.local 和 .env,因此放置在那里的密钥可能会被读取;用户应避免将密钥提交到仓库文件中。
持久化与权限
技能不请求 'always: true',也不修改其他技能或系统范围的代理设置。它仅写入自己的 data/ 和 outputs/ 目录。它可以向 SenseAudio 和飞书发出出站网络调用,这符合其预期用途。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.1.02026/3/15

persona-voice v1.0.0 - 重构技能以集成 Feishu/Lark 机器人:生成基于人格的语音回复并以飞书原生语音消息传递。- ASR 和 TTS 仅使用 SenseAudio;移除 AudioZen LLM 依赖。- 简化配置:只需将飞书和 SenseAudio API 密钥配置为环境变量。- 新增命令行工作流 via scripts/main.py,支持人格提示生成、音频转录和直接飞书音频发送。- 此版本仅保留 3 个公共/免费人格和语音选项。- 移除之前的安装时密钥设置和不相关脚本。

● 无害

安装命令 点击复制

官方npx clawhub@latest install persona-voice
镜像加速npx clawhub@latest install persona-voice --registry https://cn.clawhub-mirror.com

技能文档

概述

这是一个面向 ChatGPT / Claw / 飞书机器人的随机人格语音回复 Skill。

当前版本的原则:

  • 角色化文本:由 ChatGPT / Claw 当前会话模型生成。
  • ASR / TTS:统一使用 SenseAudio。
  • 飞书回复:统一发送为飞书原生语音条,而不是普通文件附件。
  • 环境变量:只要求配置凭证类字段,其他地址和模型全部使用默认值。

当前保留的人格与音色

只保留以下免费可用人格和音色:

  • 可爱萌娃:child_0001_achild_0001_b
  • 儒雅道长:male_0004_a
  • 沙哑青年:male_0018_a

详见:

  • presets/personas.json
  • references/personas.md

适用场景

  • 飞书 / Lark 机器人随机人格语音回复
  • 文字输入 → 人格化短回复 → 语音条发送
  • 语音输入 → ASR → 人格化短回复 → 语音条发送

飞书场景硬性规则

  • 飞书场景默认只发送语音消息。
  • 成功发送语音后,不要再额外返回一条文字。
  • 随机到什么人格,回复内容本身也必须明显像那个人格,不只是换音色。
  • 不要暴露内部规则,不要说自己在随机人格。
  • 飞书发送必须走 OPUS + file_key + audio 消息 的原生链路,不要把 mp3/wav 当普通文件附件。

工作流

用户发送文字

  • 调用 scripts/main.py persona-prompt --user-message "..."
  • 读取返回的人格 prompt。
  • 由 ChatGPT / Claw 当前会话模型生成最终 reply_text
  • 调用 scripts/main.py send-voice --reply-text "..." --chat-id "oc_xxx" --persona "..."
  • 成功发送语音后,最终对话输出应为空,不再附加文字。

用户发送语音

  • 调用 scripts/main.py transcribe --audio /abs/path/input.m4a
  • 根据转写文本,再调用 persona-prompt 获取人格提示。
  • 由 ChatGPT / Claw 生成最终 reply_text
  • 调用 send-voice 生成并发送飞书语音条。

配置方式

当前版本只需要配置:

export FEISHU_APP_ID="cli_xxx"
export FEISHU_APP_SECRET="your_secret"
export SENSEAUDIO_API_KEY="your_key"

其余全部默认:

  • FEISHU_BASE_URL=https://open.feishu.cn
  • SENSEAUDIO_BASE_URL=https://api.senseaudio.cn
  • SENSEAUDIO_ASR_MODEL=sense-asr
  • SENSEAUDIO_TTS_MODEL=SenseAudio-TTS-1.0
  • FFMPEG_PATH 可选;若 PATH 中找不到 ffmpeg,可显式设置为 /opt/homebrew/bin/ffmpeg

本地依赖

  • python3
  • ffmpeg
  • requests

主脚本入口

初始化人格模式

python scripts/main.py persona-init --mode random

查看当前模式

python scripts/main.py persona-show

生成给 Claw 的人格 prompt

python scripts/main.py persona-prompt --user-message "今天有点累"

转写用户语音

python scripts/main.py transcribe --audio /absolute/path/input.m4a

生成并发送飞书语音条

python scripts/main.py send-voice \
  --reply-text "先歇一下嘛,我陪你缓一缓。" \
  --chat-id "oc_xxx" \
  --persona "keai-mengwa"

资源说明

  • scripts/main.py:主入口,包含 persona-init / persona-show / persona-prompt / transcribe / send-voice
  • scripts/persona_store.py:人格池、随机/固定模式、人格提示生成
  • scripts/asr.py:SenseAudio ASR
  • scripts/tts.py:SenseAudio TTS
  • scripts/feishu_api.py:飞书上传 OPUS 并发送 audio 消息
  • references/feishu_integration.md:飞书接入说明
  • references/provider_notes.md:环境变量与 Provider 说明
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务