运行时依赖
无特殊依赖
安装命令 点击复制
官方clawhub install yuyonghao-agent-eval-suite
镜像加速clawhub install yuyonghao-agent-eval-suite --registry https://cn.clawhub-mirror.com
技能文档
概述
代理评估套件是一套用于评估代理性能的工具,包括基准测试、A/B 测试、性能回归检测和模拟环境测试。使用指南
- 基准测试:评估代理在标准条件下的性能。
- A/B 测试:比较两种或更多代理配置的效果。
- 性能回归检测:识别代理更新后是否引入性能问题。
- 模拟环境测试:在模拟的环境中测试代理,以模拟各种场景。
示例
# 示例命令,实际命令请参考原始文档
agent-eval-suite run --test-type benchmark
注意
- 请替换为实际命令和配置,根据原始文档进行。- 本翻译仅供参考,具体使用请依据原始英文文档。
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制