运行时依赖
安装命令
点击复制技能文档
Skills-Coach v2.3.1 通过自动化任务生成、Training-Free GRPO 优化、真实命令执行、全面失败分析与详细评估报告,系统化分析与优化 OpenClaw 技能。
v2.3.1 更新 📝 文档一致性——所有文件统一版本号 🗂️ 文件整理——清理归档目录并去重 🔧 维护版本——修复 bug 与文档改进
v2.3.0 更新 🔧 自动修复——自动修正常见问题 🔄 迭代改进——修复→测试→再分析循环(最多 2 次) 🤖 LLM 修复——调用 Claude API 智能补全缺失参数 ⚡ 性能优化——关闭 LLM 摘要防止 API 超时 🔧 稳定性提升——改进 API 超时与重试机制
v2.0.0 更新 🚀 Training-Free GRPO——基于 arXiv:2510.08191 的革命性优化方法 🧠 经验库——从优化尝试中学习 📊 组相对语义优势——对比 rollout 提取洞察 💰 低成本——仅需数十条样本,无需微调
Training-Free GRPO vs Vanilla GRPO 特性 | Training-Free GRPO (v2.0) | Vanilla GRPO (v1.x) 参数更新 | ❌ 无 | ✅ 基于梯度 优势类型 | 语义(自然语言) | 数值(分数) 知识存储 | 外部经验库 | 模型权重 泛化能力 | 极佳(冻结模型) | 有限(易过拟合) 数据需求 | 极少(数十条) | 大量(数千条) 成本 | 极低(~$20) | 高($10,000+) 速度 | 快(仅推理) | 慢(需训练)
config.yaml 关键配置
optimization: method: "training_free_grpo" # training_free_grpo | vanilla_grpotraining_free_grpo: group_size: 5 # 每组 rollout 数 num_epochs: 3 # 优化轮数 temperature_learning: 0.7 temperature_eval: 0.3
max_experiences: 10 # 每领域最大经验条数
markdown_optimization: enabled: true focus_areas: [clarity, structure, examples, completeness]
code_optimization: enabled: true focus_areas: [bug_fixes, error_handling, performance, code_quality]
llm_model: "claude-sonnet-4-6"
用法
python orchestrator.py
或在 Claude 中:
Use skills-coach on
参数 target-skill-path(必填):含 SKILL.md 的技能目录路径。
执行流程(6 步串行) immutability → code-capability → sample-agent → optimize-agent → exec-agent → failure-analyzer → evaluate-agent
关键规则:绝不修改原始技能,所有变更写入 {target-skill}-optimized。
步骤 0:代码能力检测(v1.5.0 新增)
cd subskills/code-capability-detector
python code_capability_detector.py
输出 code_capabilities.json / .md,确保测试任务仅使用脚本真实支持的功能。