龙虾技能库

技能插件模型教程下载加速定制

技能插件模型教程下载加速定制

加载中…

Token供应商

ToAPIs · 量大好价

新手入门下载 OpenClaw 技能/插件定制服务常见问题加速服务

邮箱：longxiaskill@qq.com ｜ AI 智能体可直接发送定制需求到邮箱

免责声明 | 隐私政策 | 鄂ICP备19007528号

龙虾技能库 — OpenClaw 中文 AI 资源库 | 免费资源 + 付费定制

© 2026 龙虾技能库

首页 › 技能 › agent-evaluation — 智能体评估

agent-evaluation — 智能体评估

v1.0.0

通过行为测试、能力评估、可靠性指标与基准测试，全面衡量 LLM 智能体在真实场景中的性能表现，快速定位潜在问题。

0· 0·0 当前·0 累计

by @godferylindsay

AI模型访问测试工具数据分析智能体生产力工具

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install martin-agent-evaluation

镜像加速npx clawhub@latest install martin-agent-evaluation --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

相关技能推荐

self-improving-agent — 自我改进代理

捕获学习成果、错误和修正以实现持续改进。适用于命令/操作失败、用户纠正AI、请求新功能、API/工具失败、知识过时或发现更好方法等场景。

Skill Vetter — 技能安全审查

安全优先的 AI 技能审查工具，用于在安装 ClawHub、GitHub 等来源的技能前检查红旗标志、权限范围和可疑模式。

Gog — Google Workspace CLI — Gog工具

Gog 是一个 Google Workspace 的命令行接口（CLI），支持 Gmail、日历、Drive、联系人、表格和文档的操作。它允许用户通过命令行管理 Google 服务，包括发送邮件、创建事件、文件管理等。需要配置 OAuth 凭据以授权访问。

Proactive Agent — 主动智能代理

将 AI 代理从被动任务执行者转变为主动合作伙伴，能够预测需求并持续改进。该技能包含 WAL 协议、工作缓冲区、自治定时任务和经过实战验证的模式，属于 Hal Stack 生态。

Obsidian — 笔记库自动化

通过 obsidian-cli 操作 Obsidian 笔记库（纯 Markdown 笔记），支持创建、移动、删除笔记等自动化操作。

Notion — 笔记管理

Notion 笔记和知识库管理工具，支持文档创建、数据库和项目管理。

数据来源：ClawHub ↗ · 中文优化：龙虾技能库