📦 Agent Onboarding — Agent 入职

v1.0.0

将代理接入 Bright Data。用于编码代理首次接触 Bright Data 时——进行实时网页操作(搜索、抓取、结构化数据),连接 Bright...

0· 15·0 当前·0 累计
meirk-brd 头像by @meirk-brd (Meir Kadosh)
0
安全扫描
VirusTotal
可疑
查看报告
OpenClaw
安全
medium confidence
该技能的说明和要求与 Bright Data 的入门流程一致,但其运行时安装指令(远程安装脚本、全局 npm install)以及可向代理动态添加新技能的能力,运行前值得谨慎审查。
评估建议
这份 SKILL.md 对 Bright Data 的入门流程是连贯的,但在执行安装步骤前请谨慎: 1. 优先使用 npm(`npm install -g @brightdata/cli`)或 npx,而非将远程安装脚本直接 pipe 到 bash;运行前请先查看 https://cli.brightdata.com/install.sh。 2. 注意 `bdata login` 会在本地存储 API key——尽量使用作用域受限的 key,不要复用高权限凭据。 3. `bdata skill add` 会在 agent 的 skill 目录中安装/修改技能;添加前请审阅这些 skill 包的功能。 4. 若想最小化暴露,可使用仅认证(Path C)或仅 REST(Path D)方案,并先在沙箱或独立环境中测试安装。...
详细分析 ▾
用途与能力
名称/描述符合要求:这是 Bright Data 的入门文档,说明如何安装 CLI、完成身份验证并添加 Bright Data skills。所需功能(CLI、API key、zones)均与此目的相符。
指令范围
SKILL.md 会提示 agent/人类安装 Bright Data CLI,运行 bdata login(在本地保存 API key 并创建 zones),并使用 bdata skill add 将技能放入 agent 的技能目录。这些操作属于 onboarding 范围,但会修改 agent 状态,并可能安装额外的技能包。
安装机制
文档建议将 https://cli.brightdata.com/install.sh 通过 bash 执行(curl | bash),这会运行远程安装脚本,风险较高。它也推荐使用 npm install -g @brightdata/cli(全局安装)或 npx,这些是风险较低的替代方案。远程安装脚本的存在是安装相关的主要风险点。
凭证需求
唯一提到的凭据是 BRIGHTDATA_API_KEY(或通过 bdata login 的 OAuth)。这与所述目的相符。说明建议将密钥本地保存或放在 .env 中以便应用集成——虽属常规,但仍需保护(使用最小权限密钥)。
持久化与权限
该 skill 并非 always:true,本身也不会持久化,但它会指导安装一个 CLI,该 CLI 可将额外 skill 放入 agent 的 skill 目录,从而可能扩展 agent 的权限/行为,应在允许自动安装前予以审查。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

安装命令

点击复制
官方npx clawhub@latest install brightdata-agent-onboarding
镜像加速npx clawhub@latest install brightdata-agent-onboarding --registry https://cn.longxiaskill.com

技能文档

Bright Data — 代理入门 Bright Data 为代理提供稳定访问开放网络的能力:

  • 真实浏览器般的 SERP 结果
  • 任意 URL 的干净 Markdown(自动处理 CAPTCHA + JS)
  • 40+ 平台的结构化数据集(Amazon、LinkedIn、Instagram、TikTok、YouTube、Reddit、Crunchbase …)
  • 需要真实交互的页面可用 Browser API

本技能是入口。读一遍,选一条路径,然后交给对应路径的专属技能。

安装 一行命令安装 CLI 与代理技能,并引导完成浏览器 OAuth:

# macOS / Linux 最快安装 curl -fsSL https://cli.brightdata.com/install.sh | bash

# 跨平台(或不想用脚本) npm install -g @brightdata/cli

# 零安装,一次性 npx --yes --package @brightdata/cli brightdata

需 Node.js ≥ 20。安装后 brightdata 与简写 bdata 均可用。

认证 bdata login

  • 打开浏览器完成 OAuth(无头/SSH 用 bdata login --device)
  • 本地保存 API key,无需再粘贴
  • 自动创建所需代理区(cli_unlocker、cli_browser)
  • 写入默认配置

非交互: bdata login --api-key # 或 export BRIGHTDATA_API_KEY=

验证 bdata version bdata config # 确认认证 + 代理区 bdata zones # 应列出 cli_unlocker、cli_browser bdata budget # 确认账户余额

任一步失败 → 先走 Path C(认证)。

安装代理技能(可选,推荐) CLI 自带安装器,可把技能直接放入编码代理的技能目录:

# 交互选择技能与目标代理 bdata skill add

# 安装指定技能 bdata skill add scrape bdata skill add data-feeds bdata skill add competitive-intel

# 查看全部 bdata skill list

路径选择 所有路径共用上述安装 + 认证,区别在后续动作。

场景 → 路径

  • 本次会话需要网页数据 → Path A 实时 CLI 工具
  • 把 Bright Data 集成到应用代码 → Path B SDK / REST
  • 给 LLM 代理加即用工具层 → Path M MCP server
  • 只要 API key → Path C 仅认证
  • 不想装任何东西 → Path D 直接 REST API

跨路径任务按顺序:认证 → 实时工具探索 → 应用集成。

Path A — 实时 CLI 工具 代理自己此刻就要数据:找 URL、拉干净内容、取平台结构化记录、快速竞品扫描。

安装 + 登录后,交给子技能:

  • brightdata-cli — 总命令面(scrape、search、pipelines、状态、代理区、预算、配置)
  • search — 发现:bdata search(Google/Bing/Yandex SERP,结构化 JSON)
  • scrape — 已知 URL 干净内容:bdata scrape(markdown/HTML/JSON/截图)
  • data-feeds — 40+ 平台结构化记录:bdata pipelines
  • competitive-intel — 竞品/定价/评论/招聘/SEO 分析包
  • seo-audit — 按 sitemap 分层的实时 SEO 审计

默认流程:

  • 需发现 → 先 search
  • 目标在支持平台 → pipelines 拿结构化 JSON
  • 有 URL 无平台 → scrape
  • 需点击/表单/登录 → Browser API(见 brightdata-cli 技能与 browser-api 最佳实践)

任务从“现在抓数据”变为“写进应用”时,切到 Path B。

Path B — 把 Bright Data 集成到应用 写应用/代理/工作流,代码里调用 Bright Data,需 BRIGHTDATA_API_KEY 与代理区写进 .env 或运行时配置。

先答:产品在哪个场景用 Bright Data? 按答案选 API:

产品任务 → API → 技能

  • 单页转 markdown/HTML/JSON → Web Unlocker → bright-data-best-practices → web-unlocker.md
  • 搜索引擎结构化结果 → SERP API → bright-data-best-practices → serp-api.md
  • 平台结构化记录 → Web Scraper API → bright-data-best-practices → web-scraper-api.md
  • JS 重/交互页面(Playwright/Puppeteer)→ Browser API → bright-data-best-practices → browser-api.md
数据来源ClawHub ↗ · 中文优化:龙虾技能库