📦 agent-evaluation — 智能体评估
v1.0.0通过行为测试、能力评估、可靠性指标与基准测试,全面衡量 LLM 智能体在真实场景中的性能表现,快速定位潜在问题。
0· 0·0 当前·0 累计
运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install martin-agent-evaluation
镜像加速npx clawhub@latest install martin-agent-evaluation --registry https://cn.longxiaskill.com