运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install reddi-agent-evaluation
镜像加速npx clawhub@latest install reddi-agent-evaluation --registry https://cn.longxiaskill.com
技能文档
介绍
reddi.tech 的 agent-evaluation 分支,用于测试和基准测试 LLM 代理。功能
- 行为测试
- 能力评估
- 可靠性指标
- 生产环境评估
# 使用指南 请参考 原始仓库 获取最新文档。
# 示例命令(假设)
./evaluate-agent --mode production
注意
- 安全提示:使用前请自行评估安全性。