首页龙虾技能列表 › Agent Eval Suite — 代理评估套件

Agent Eval Suite — 代理评估套件

v?

提供代理评估的基准测试、A/B 测试、性能回归检测和模拟环境测试,帮助开发者全面评估代理性能。

0· 63·0 当前·0 累计

运行时依赖

无特殊依赖

安装命令 点击复制

官方clawhub install yuyonghao-agent-eval-suite
镜像加速clawhub install yuyonghao-agent-eval-suite --registry https://cn.clawhub-mirror.com

技能文档

概述

代理评估套件是一套用于评估代理性能的工具,包括基准测试、A/B 测试、性能回归检测和模拟环境测试。

使用指南

  • 基准测试:评估代理在标准条件下的性能。
  • A/B 测试:比较两种或更多代理配置的效果。
  • 性能回归检测:识别代理更新后是否引入性能问题。
  • 模拟环境测试:在模拟的环境中测试代理,以模拟各种场景。

示例

# 示例命令,实际命令请参考原始文档
agent-eval-suite run --test-type benchmark

注意

  • 请替换为实际命令和配置,根据原始文档进行。- 本翻译仅供参考,具体使用请依据原始英文文档。
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务