Evolution Drift Detector — 进化漂移检测器
v1.0.0帮助检测AI代理技能在继承链中静默变异。某一技能在第一代被审计为安全,但可能在第五代时已经远离原始版本 —— 但由于名称未变,没人会重新审计。
运行时依赖
版本
Functional: 8 changes
安装命令
点击复制技能文档
在 Gen 1 中,一个技能通过审计。到了 Gen 5,它获得了网络访问权限。然而,没有人注意到这一点。它有助于检测 AI 技能在继承链中传播时的静默突变,捕捉静态分析原始版本可能忽略的偏差。问题技能 A 发布并审计:干净。代理 B 继承技能 A,进行小的修改 — 添加一个便利函数。代理 C 继承自 B,添加错误处理,恰好包括一个 HTTP 重试机制。代理 D 继承自 C,现在拥有一个具有网络访问权限的技能,而原始审计从未见过。每个个体变化都很小,很合理。但是,累积的偏差将一个文件读取实用程序转化为可以发送数据到网络的东西。原始的“已验证安全”徽章仍然适用于市场 — 因为从技术上讲,它是相同的技能血统。这就是进化偏差:小的、个别无害的突变累积成一个根本不同的生物体。在生物学中,这就是物种分化的方式。在代理生态系统中,这就是安全技能变成不安全技能而没有人引起注意的方式。
这项检查检测技能血统并计算语义偏差:
- 血统重构 — 给定一个技能,追溯其继承链到原始发布版本。
- 每代差异 — 对于每个世代,计算结构化差异:添加的新功能、更改的权限、引入的外部依赖。
- 偏差评分 — 将各个世代的差异聚合成一个单一的偏差指标。
- 突变分类 — 将每个变化分类:美观(格式、注释)、功能(新逻辑)、功能扩展(新权限、新的外部调用)、安全性降低(删除检查、削弱验证)。
- 偏差警报阈值 — 标记累积偏差超过原始审计范围的血统。
如何使用: 输入:提供一个技能 slug 或标识符来追溯其完整血统,或者两个技能版本来计算它们之间的偏差,或者一个市场继承链 URL。 输出:一个包含以下内容的偏差分析报告:
- 带有世代标记的血统树。
- 每代差异摘要。
- 功能偏差评分(0-100)。
- 突变分类细分。
- 重新审计推荐:是 / 观察 / 否。
示例输入:检查数据清理技能(当前在第 5 代)的偏差。 🧬 进化偏差报告 — 重新审计推荐 血统:数据清理技能 Gen 1:原始版本由 @securitylab 创建(审计通过 2025-03-15)。 Gen 2:@toolsmith 的分支 — 添加 CSV 支持。 Gen 3:@agent-builder 的分支 — 添加带有 HTTP 回退的重试逻辑。 Gen 4:@pipeline-dev 的分支 — 添加远程模式获取。 Gen 5:@data-team 的分支 — 当前市场版本。 每代功能变化:
- Gen 1→2:+csv_parsing(功能,低风险)。
- Gen 2→3:+http_requests(功能扩展,中等风险)。
- Gen 3→4:+remote_fetch(功能扩展,高风险)。
- Gen 4→5:-input_length_check(安全性降低,中等风险)。
- 美观:12 次变化。
- 功能:8 次变化。
- 功能扩展:2 次变化 ⚠️。
- 安全性降低:1 次变化 ⚠️。
相关工具:
- blast-radius-estimator — 一旦检测到偏差,就使用 blast-radius 估计有多少代理运行偏差版本。
- trust-decay-monitor — 跟踪审计有效性的时间衰减;evolution-drift-detector 跟踪继承链中的内容衰减。
- hollow-validation-checker — 检查验证测试是否有意义;偏差技能可能通过原始测试,但这些测试不再涵盖当前功能。
- supply-chain-poison-detector — 检测故意污染的技能;偏差检测捕捉风险的无意累积。
限制:
- 血统重构依赖于市场元数据质量 — 如果分支关系未被跟踪,完整的链可能无法恢复。
- 功能偏差评分使用变化的启发式分类,一些突变可能被误分类(例如,一个“功能”变化隐式扩展功能)。
- 检测器分析了什么变化,而不是变化是否恶意 — 高偏差评分意味着重新审计是必要的,而不是技能被损害。
- 具有混淆或