📦 Agent Eval Suite — 代理评估套件
v?提供代理评估的基准测试、A/B 测试、性能回归检测和模拟环境测试,帮助开发者全面评估代理性能。
0· 63·0 当前·0 累计
运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install yuyonghao-agent-eval-suite
镜像加速npx clawhub@latest install yuyonghao-agent-eval-suite --registry https://cn.longxiaskill.com镜像同步中
技能文档
概述
代理评估套件是一套用于评估代理性能的工具,包括基准测试、A/B 测试、性能回归检测和模拟环境测试。使用指南
- 基准测试:评估代理在标准条件下的性能。
- A/B 测试:比较两种或更多代理配置的效果。
- 性能回归检测:识别代理更新后是否引入性能问题。
- 模拟环境测试:在模拟的环境中测试代理,以模拟各种场景。
示例
# 示例命令,实际命令请参考原始文档
agent-eval-suite run --test-type benchmark
注意
- 请替换为实际命令和配置,根据原始文档进行。- 本翻译仅供参考,具体使用请依据原始英文文档。