Ai Output Acceptance Test Builder — AI 输出接受测试构建器
v1.0.0将AI生成的可交付成果转化为实用的验收测试包,包括成功标准、验证检查、边界案例、修订提示和最终...
运行时依赖
安装命令
点击复制本土化适配说明
Ai Output Acceptance Test Builder — AI 输出接受测试构建器 安装说明: 安装命令:["openclaw skills install ai-output-acceptance-test-builder"]
技能文档
AI 输出验收测试构建器概述 AI 输出验收测试构建器帮助用户决定是否可以使用 AI 生成的输出。它适用于文档、计划、简报、分析、电子邮件、研究摘要、创意草稿和其他基于文本的 AI 输出。该技能生成一个一页的验收测试包,定义成功标准,列出必须验证的内容,探测弱点,并为用户提供最终的通过/不通过清单。该技能不是正确性证书,不替代专家审查、运行代码、验证法律或医疗建议或确认事实。它为用户提供了在依赖 AI 输出之前的结构化审查层。
何时使用 当用户询问以下内容时使用此技能: 检查 AI 生成的工作是否足够好 为 AI 草稿或输出创建验收标准 审查 AI 计划、文档、电子邮件、分析或摘要 在 AI 输出中找到风险、缺失部分、边缘情况或弱假设 在发送、发布或采取 AI 工作之前构建通过/不通过清单 触发短语: "这个 AI 输出是否足够好?" "帮助我 QA 这个 AI 草稿" "为这个 AI 生成的计划创建验收测试" "如何检查 AI 生成的工作是否可用?" "在我依赖它之前审查这个 AI 答案"
所需输入 请求最少的上下文: AI 输出或其摘要 输出类型和预期的现实世界使用 目标受众或决策者 风险、截止日期和失败成本 任何已知的约束、源材料、事实、计算、引用或要求 如果用户无法共享完整的输出,请从摘要开始并明确标记置信度限制。
工作流程 步骤 1 - 确定输出及其使用 捕获 AI 生成的内容及其预期使用方式。澄清其是否用于内部思考、公共帖子、客户交付、学校作业、商业决策、运营计划或其他用途。
步骤 2 - 校准风险和审查深度 分类审查级别: 低风险:粗略的大脑风暴、私人笔记、早期草稿 中等风险:工作场所文档、客户沟通、规划、公共内容 高风险:法律、医疗、金融、安全、就业、学术诚信、代码部署或不可逆转的决定 对于高风险使用,包括强大的专家或权威来源审查提醒。
步骤 3 - 定义验收标准 编写 3 到 7 个描述输出可用性的简单语言标准。标准应具体、可测试且与用户的预期使用相关。标准类型示例: 足够准确以满足预期用途 与用户要求相符 清晰易懂 无隐含假设 与源材料一致 安全、合乎道德且适当地标注 适当地格式化以适应渠道
步骤 4 - 列出必须验证的项目 确定用户在依赖输出之前必须检查的声明和组件: 事实、名称、日期、数字、定义和引语 计算、公式、比较和估计 引用、链接、参考或源声明 命令、程序、政策或合规声明 关于人员、市场、法律、医学、安全、金融或技术系统的假设 标记每个项目为用户可验证、源可验证或专家可验证。
步骤 5 - 生成边缘情况和故障探测 创建针对输出的有针对性的问题。包括探测问题,如: 哪个重要场景缺失? 什么会使这些建议失败? 哪个受众反对最有可能? 哪个隐含假设正在做最多的工作? 如果照字面理解会有什么误导? 哪个怀疑的审查者会首先挑战什么?
步骤 6 - 确定红旗 列出应阻止接受直到修订的警告信号,例如: 带有信心的不支持声明 没有上下文的模糊建议 缺失的约束或受众需求 不一致的逻辑或未解释的跳跃 伪造的引用或不可验证的参考 过于宽泛的法律、医疗、金融或安全声明 语气不匹配、隐私泄露或敏感信息泄露
步骤 7 - 创建修订提示 编写针对性的提示,用户可以将其粘贴回 AI 系统以修复弱点。每个提示应命名问题、请求特定的改进并保留原始输出的有用部分。包括提示以: 填补空白 紧固标准 添加警告 检查假设 重新格式化以适应受众 为高风险使用生成更保守的版本
步骤 8 - 生成验收测试包 创建最终交付物,包括以下部分: 用例和风险摘要 验收标准 必须验证的项目 边缘情况探测 红旗 修订提示 最终通过/不通过清单 置信度注意事项和审查所有者
步骤 9 - 给出通过/修订/拒绝建议 以以下三个标签之一结束: 通过:准备就绪 修订:需要修订 拒绝:不建议使用