📦 Reddi Agent Evaluation — Reddi 代理评估 — 评估LLM代理性能

v?

reddi.tech 的 agent-evaluation 分支,用于测试和基准测试 LLM 代理,包括行为测试、能力评估、可靠性指标和生产环境评估。

0· 179·0 当前·0 累计
0

运行时依赖

无特殊依赖

安装命令

点击复制
官方npx clawhub@latest install reddi-agent-evaluation
镜像加速npx clawhub@latest install reddi-agent-evaluation --registry https://cn.longxiaskill.com

技能文档

介绍

reddi.tech 的 agent-evaluation 分支,用于测试和基准测试 LLM 代理。

功能

  • 行为测试
  • 能力评估
  • 可靠性指标
  • 生产环境评估

# 使用指南 请参考 原始仓库 获取最新文档。

# 示例命令(假设)
./evaluate-agent --mode production

注意

  • 安全提示:使用前请自行评估安全性。
数据来源ClawHub ↗ · 中文优化:龙虾技能库