📦 Skylv Agent Performance Profiler — 性能剖析优化

v1.0.1

面向智能体的性能剖析器,实时统计响应时间、Token消耗与工具调用效率,自动生成可视化报告并给出针对性优化建议,助你低成本提升AI交互体验。

0· 16·1 当前·1 累计
sky-lv 头像by @sky-lv (SKY-lv)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/18
0
安全扫描
VirusTotal
Pending
查看报告
OpenClaw
安全
high confidence
该技能的请求与指令与智能体性能剖析目的完全一致,仅为指令型指南,不索取凭据,也不安装任何代码。
评估建议
本技能为纯指令型剖析指南,内部逻辑一致且风险较低,因无需凭据、不安装代码。安装前:(1) 确认你的OpenClaw智能体如何向技能提供遥测数据(Token数、响应时间、工具调用轨迹),并确保轨迹不会泄露敏感信息;(2) 若计划采集聊天记录或工具输出,请先脱敏PII与API密钥;(3) 由于技能未审计代码(仅为文档),请将其优化建议视为需在受控环境验证的推荐,而非自动执行操作。如需更高保障,请向发布方索取数据收集细节及剖析例程的输入/输出样例。...
详细分析 ▾
用途与能力
名称与描述(智能体性能剖析、Token用量、延迟、工具调用)与SKILL.md内容一致,未请求无关环境变量、二进制文件或安装步骤。
指令范围
SKILL.md提供指标、测试用例、优化策略及示例辅助函数签名,未指示智能体读取系统文件、环境变量或文档链接外的外部URL,但隐式假设可访问智能体遥测(响应时间、Token数、工具调用轨迹)。技能未说明这些轨迹如何采集及来源,请确认调用时智能体将暴露哪些运行时数据。
安装机制
无安装规范与代码文件——仅指令。技能本身不下载或写入磁盘,最大限度降低安装时风险。
凭证需求
技能未声明所需环境变量、凭据或配置路径,不请求密钥或无关服务Token。
持久化与权限
标志显示默认行为(always: false, agent invocation allowed)。技能未要求持久/强制包含或更改其他技能权限。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.12026/4/18

- 将SKILL.md中的版本更新为1.0.1。 - 无其他内容或功能变更;文档与特性保持先前描述不变。

Pending

安装命令

点击复制
官方npx clawhub@latest install skylv-agent-performance-profiler
镜像加速npx clawhub@latest install skylv-agent-performance-profiler --registry https://cn.longxiaskill.com

技能文档

# Agent Performance Profiler — 性能分析与优化 ## 功能说明 深度分析 AI Agent 性能,包括响应时间、Token 消耗、工具调用效率,提供可执行的优化建议。让 Agent 更快、更省、更稳定。 ## 核心指标 ### 1. 响应时间 (Response Time) ``yaml metrics: - first_token_latency: 首 Token 延迟(目标:<500ms) - total_response_time: 总响应时间(目标:<3s) - time_to_first_byte: 首字节时间 - streaming_latency: 流式延迟 benchmarks: - simple_query: <1s - complex_task: <5s - multi_tool: <10s ` ### 2. Token 消耗 (Token Usage) `yaml metrics: - input_tokens: 输入 Token 数 - output_tokens: 输出 Token 数 - total_tokens: 总 Token 数 - cost_per_request: 单次请求成本 optimization: - prompt_compression: 提示词压缩 - context_pruning: 上下文裁剪 - response_summarization: 响应摘要 ` ### 3. 工具调用效率 (Tool Efficiency) `yaml metrics: - tool_call_count: 工具调用次数 - tool_success_rate: 工具成功率(目标:>95%) - redundant_calls: 冗余调用数 - parallel_opportunities: 可并行机会 optimization: - batch_calls: 批量调用 - cache_results: 缓存结果 - parallel_execution: 并行执行 ` ### 4. 错误率 (Error Rate) `yaml metrics: - api_error_rate: API 错误率(目标:<1%) - timeout_rate: 超时率(目标:<2%) - retry_rate: 重试率(目标:<5%) alerts: - error_spike: 错误率突增 - latency_spike: 延迟突增 - cost_spike: 成本突增 ` ## 性能分析流程 ### 1. 基线测试 `yaml test_cases: - simple_qa: 简单问答 - multi_step: 多步任务 - tool_intensive: 工具密集型 - context_heavy: 重上下文 metrics_collected: - response_time - token_usage - tool_calls - error_rate ` ### 2. 瓶颈识别 `yaml common_bottlenecks: - verbose_prompts: 提示词过长 - redundant_tool_calls: 冗余工具调用 - sequential_execution: 顺序执行(可并行) - context_bloat: 上下文膨胀 - inefficient_retries: 低效重试 ` ### 3. 优化建议 `yaml optimization_strategies: - prompt_optimization: - 移除冗余描述 - 使用结构化输出 - 添加示例(few-shot) - tool_optimization: - 批量调用 - 结果缓存 - 并行执行 - context_optimization: - 相关性过滤 - 摘要压缩 - 向量检索 ` ## 优化技巧 ### 提示词优化 ❌ 低效: ` 你是一个很有帮助的 AI 助手,你需要帮助用户完成各种任务。 请仔细阅读用户的问题,然后思考如何解决。 你需要考虑各种因素,包括...(冗长描述) ` ✅ 高效: ` 角色:{专业角色} 任务:{具体任务} 输出格式:{JSON/Markdown/列表} 约束:{限制条件} ` 效果: Token 减少 60%,响应时间减少 40% ### 工具调用优化 ❌ 低效(顺序调用): ` 1. 搜索 A 2. 搜索 B 3. 搜索 C 4. 合并结果 ` ✅ 高效(并行调用): ` 并行: - 搜索 A - 搜索 B - 搜索 C 合并结果 ` 效果: 响应时间减少 70% ### 上下文优化 ❌ 低效(完整历史): ` [完整对话历史,5000+ Token] ` ✅ 高效(相关性过滤): ` [最近 5 轮对话] [相关记忆摘要,500 Token] ` 效果: Token 减少 80%,成本减少 80% ## 工具函数 ### profile_agent `python def profile_agent(task: str, iterations: int = 10) -> dict: """ Agent 性能分析 Args: task: 测试任务 iterations: 测试迭代次数 Returns: { "avg_response_time": 1.23, # 秒 "p95_response_time": 2.45, "avg_tokens": 450, "avg_cost": 0.002, # 美元 "tool_calls": 3.2, # 平均每次 "error_rate": 0.02 # 2% } """ ` ### optimize_prompt `python def optimize_prompt(prompt: str) -> dict: """ 提示词优化 Args: prompt: 原始提示词 Returns: { "original_tokens": 500, "optimized_tokens": 200, "reduction": 0.6, "optimized_prompt": "优化后的提示词", "changes": ["移除冗余", "结构化", "添加示例"] } """ ` ### analyze_tool_calls `python def analyze_tool_calls(trace: list) -> dict: """ 工具调用分析 Args: trace: 工具调用追踪 Returns: { "total_calls": 15, "redundant_calls": 3, "parallel_opportunities": 2, "cache_hits": 5, "optimization_suggestions": [ "合并 A 和 B 调用", "并行执行 C 和 D", "缓存 E 的结果" ] } """ ` ## 性能基准 ### 优秀 Agent 标准 | 指标 | 优秀 | 良好 | 需优化 | |------|------|------|--------| | 响应时间 | <1s | 1-3s | >3s | | Token 效率 | <300 | 300-800 | >800 | | 工具成功率 | >98% | 95-98% | <95% | | 成本/请求 | <$0.001 | $0.001-0.005 | >$0.005 | ### 成本计算 `yaml 模型定价(参考): - GPT-4: $0.03/1K input, $0.06/1K output - Claude-Sonnet: $0.003/1K input, $0.015/1K output - Qwen-Plus: ¥0.004/1K input, ¥0.012/1K output 示例: 输入 500 Token + 输出 300 Token GPT-4 成本:$0.033 Claude-Sonnet 成本:$0.006 Qwen-Plus 成本:¥0.0056 `` ## 相关文件 - OpenClaw 性能优化指南 - Token 优化最佳实践 - Agent 调试工具 ## 触发词 - 自动:检测 performance、optimize、token、latency、profiling 相关关键词 - 手动:/agent-profiler, /performance-analysis, /optimize-agent - 短语:性能分析、优化 Agent、Token 消耗、响应时间 ## Usage 1. Install the skill 2. Configure as needed 3. Run with OpenClaw

数据来源ClawHub ↗ · 中文优化:龙虾技能库