📦 agent-evaluation — 智能体评估

v1.0.0

通过行为测试、能力评估、可靠性指标与基准测试,全面衡量 LLM 智能体在真实场景中的性能表现,快速定位潜在问题。

0· 0·0 当前·0 累计
0

运行时依赖

无特殊依赖

安装命令

点击复制
官方npx clawhub@latest install martin-agent-evaluation
镜像加速npx clawhub@latest install martin-agent-evaluation --registry https://cn.longxiaskill.com
数据来源ClawHub ↗ · 中文优化:龙虾技能库