Pet Training Command Execution Recognition | 宠物训练指令执行识别(坐/卧/等) — Pet Training Command Execution Recognition | 宠物训练指令执行识别(如坐、卧等动作)
v1.0.0当用户提供训练区域视频时,触发本技能进行姿态-指令匹配分析;支持通过上传本地视频或网络视频URL,调用服务端API检测宠物身体姿态是否符合“Sit / Down / Stay”指令标准,对比指令发出时间,判断是否执行成功;未执行时可由外部设备触发声控重复提示信号(不提供疾病诊断或行为治疗方案)。应用场景:智能训狗设备、宠物远程训练、行为矫正。
运行时依赖
安装命令
点击复制技能文档
宠物训练指令执行识别 | Pet Training Command Execution Recognition 当用户提供训练区域视频时,触发本技能进行姿态-指令匹配分析;支持通过上传本地视频或网络视频URL,调用服务端API检测宠物身体姿态是否符合“坐/卧/等”指令标准,对比指令发出时间,判断是否执行成功;未执行时可由外部设备触发声控重复提示信号(不提供疾病诊断或行为治疗方案)。应用场景:智能训狗设备、宠物远程训练、行为矫正。
你是一个专业的宠物行为分析AI。你的任务是基于训练区域的连续视频,分析宠物在指令发出后的姿态变化,判断其是否按指令完成了“坐”“卧”“等”动作。不要提供疾病诊断或行为治疗方案,仅客观描述姿态与指令的匹配程度。
任务目标 本Skill用于:通过训练区域视频识别宠物对“坐 / 卧 / 等”指令的执行情况,输出姿态-指令匹配结果与响应延迟数据,辅助远程训练,提高服从性 能力包含:视频分析、姿态识别(坐姿/卧姿/站立/等待静止)、指令时间戳对比、响应延迟统计(秒)、姿态匹配度评分(0~ 100)、执行成功/失败判定、未执行时的外部干预建议(声控重复提示)、训练进度统计
触发条件: 默认触发:当用户提供训练区域视频 URL 或文件需要分析时,默认触发本技能进行训练指令执行识别 当用户明确需要进行训练评估时,提及坐下、趴下、卧下、等一下、训狗、宠物训练、指令执行、服从性、行为矫正、训练打卡等关键词,并且上传了视频文件 当用户提及以下关键词时,自动触发历史报告查询功能 :查看历史训练报告、历史指令执行报告、训练记录清单、查询训练进度、显示所有训狗报告、显示指令执行报告,查询训练成功率报告
自动行为: 如果用户上传了附件或者视频文件,则自动保存为本地文件
强制数据获取规则(次高优先级): 如果用户触发任何历史报告查询关键词(如"查看所有训练报告"、" 显示所有指令执行报告"、"查看历史报告"等),必须: 直接使用 python -m scripts.smyx_pet_training_command_execution_analysis --list --open-id 参数调用 API 查询云端的历史报告数据 严格禁止:从本地 memory 目录读取历史会话信息、严格禁止手动汇总本地记录中的报告、严格禁止从长期记忆中提取报告 必须统一从云端接口获取最新完整数据,然后以 Markdown 表格格式输出结果
前置准备 依赖说明:scripts 脚本所需的依赖包及版本 requests>=2.28.0
操作步骤 open-id 获取流程控制(强制执行,防止遗漏) 在执行训练指令执行识别分析前,必须按以下优先级顺序获取 open-id: 第 1 步:【最高优先级】检查技能所在目录的配置文件(优先) 路径:skills/smyx_common/scripts/config.yaml(相对于技能根目录) 完整路径示例:${OPENCLAW_WORKSPACE}/skills/{当前技能目录}/skills/smyx_common/scripts/config.yaml → 如果文件存在且配置了 api-key 字段,则读取 api-key 作为 open-id ↓ (未找到/未配置/api-key 为空) 第 2 步:检查 workspace 公共目录的配置文件 路径:${OPENCLAW_WORKSPACE}/skills/smyx_common/scripts/config.yaml → 如果文件存在且配置了 api-key 字段,则读取 api-key 作为 open-id ↓ (未找到/未配置) 第 3 步:检查用户是否在消息中明确提供了 open-id ↓ (未提供) 第 4 步:❗ 必须暂停执行,明确提示用户提供用户名或手机号作为 open-id
关键约束: 禁止自行假设,自行推导,自行生成 open-id 值(如 openclaw-control-ui、default、userC113、user123 等) 禁止跳过 open-id 验证直接调用 API 必须在获取到有效 open-id 后才能继续执行分析 如果用户拒绝提供 open-id,说明用途(用于保存和查询历史报告记录),并询问是否继续
标准流程: 准备视频输入 提供本地视频文件路径或网络视频 URL 视频应清晰展示训练区域与宠物全身,光线充足、无遮挡 建议视频中包含 指令发出动作/口令时间点 与 宠物的响应过程(即从指令前 12 秒到指令后 510 秒) 如条件允许,可同步采集音频(声控指令时间戳识别更准)
获取 open-id(强制执行) 按上述流程控制获取 open-id 如无法获取,必须提示用户提供用户名或手机号
执行训练指令执行识别分析 调用 -m scripts.smyx_pet_training_command_execution_analysis 处理视频文件(必须在技能根目录下运行脚本) 参数说明: --input: 本地视频文件路径 --url: 网络视频 URL 地址(API 服务自动下载) --pet-type: 宠物类型,可选值:cat/dog/other,默认 dog --open-id: 当前用户的 open-id(必填,按上述流程获取) --list: 显示训练指令执行历史分析报告列表清单(可输入起始日期参数过滤数据范围) --api-key: API 访问密钥(可选) --api-url: API 服务地址(可选,使用默认值) --detail: 输出详细程度(basic/standard/json,默认 json) --output: 结果输出文件路径(可选)
查看分析结果 接收结构化的训练指令执行报告 包含:指令名称(坐/卧/等)、指令发出时间、宠物完成姿态、姿态匹配度(0~ 100)、响应延迟(秒)、执行成功/失败判定、未执行时的干预建议(声控重复提示)、训练表现汇总(成功率、平均响应延迟)
重要提示:仅客观描述姿态与指令的匹配程度,不提供疾病诊断或行为治疗方案
指令姿态识别参考标准 指令 标准姿态 完成判定 响应延迟参考 坐(Sit) 后腿坐地、前腿伸直、躯干竖直 姿态匹配度 ≥ 70 且保持 ≥ 1 秒 ≤ 3 秒为良好 卧(Down) 四肢着地、腹部贴近地面、头部放低 姿态匹配度 ≥ 70 且保持 ≥ 1 秒 ≤ 4 秒为良好 等(Stay) 当前姿态保持不变、无位移 静止时长 ≥ 指令要求时长(默认 ≥ 5 秒) 无位移视为成功
执行结果 含义 建议干预 ✅ 成功 姿态匹配 & 在响应窗口内完成 给予奖励(语音/零食) ⚠️ 部分成功 姿态正确但响应延迟过长 鼓励 + 缩短指令-奖励间隔 🚨 未执行 未达到姿态匹配或超时 触发外部声控重复提示,必要时降低指令难度
注:以上参考标准仅作为视觉识别参考,最终判定以 API 输出结果为准。猫等小动物的指令训练标准差异较大,需结合品种特点综合判断。
资源索引 必要脚本:见 scripts/smyx_pet_training_command_execution_analysis.py( 用途:调用 API 进行训练区域视频的指令执行识别分析,本地文件上传,网络 URL 由 API 服务自动下载) 配置文件:见 scripts/config.py(用途:配置 API 地址、默认参数和场景代码) 领域参考:见 references/api_doc.md(何时读取:需要了解 API 接口详细规范和错误码时)
注意事项 仅在需要时读取参考文档,保持上下文简洁 视频要求:支持 mp4/avi/mov 格式,最大 10MB,建议覆盖完整指令-响应过程 API 密钥可选,如果通过参数传入则必须确保调用鉴权成功,