Browser Automation - 浏览器自动化交互
v1.0.1通过自然语言在命令行下调用 Stagehand CLI,实现对网页的打开、导航、数据抽取、截图、表单填写、按钮点击等浏览器操作,支持本地 Chrome 或远程 Browserbase 环境。
56· 4.2万·0 当前·0 累计
下载技能包
License
MIT-0
此技能需要访问外网资源,可能需要科学上网
运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install browser-automation
镜像加速npx clawhub@latest install browser-automation --registry https://cn.longxiaskill.com 镜像可用
国内专用npm install --registry=https://registry.npmmirror.com && npm link
本土化适配说明
首次使用前,请确保已安装 Node.js。执行以下命令安装依赖并全局链接 `browser` 命令。若需要使用远程 Browserbase 环境,请在项目根目录创建 `.env` 并填写 `BROWSERBASE_API_KEY`、`BROWSERBASE_PROJECT_ID`。
技能文档
bash npm install # 安装依赖 npm link # 创建全局Browser Automation使用 Stagehand CLI 与 Claude 实现浏览器交互自动化。
首先:环境选择(本地 vs 远程)
技能会自动在本地 Chrome 浏览器和远程 Browserbase 环境之间切换:
- 如果
.env文件中存在 Browserbase API 密钥(BROWSERBASE_API_KEY和BROWSERBASE_PROJECT_ID):使用远程 Browserbase 环境- 若没有 Browserbase API 密钥:回退到本地 Chrome 浏览器
- 无需用户交互:根据已有配置自动完成选择
初始化(仅首次执行)
检查本目录下的
setup.json。若setupComplete: false:
browser 命令
命令列表
在两种模式下,所有命令表现一致:
browser navigate # 打开指定 URL
browser act "" # 使用自然语言描述的操作
browser extract "" ['{}'] # 抽取数据(可选 JSON Schema)
browser observe "" # 查询页面元素
browser screenshot # 截取当前页面截图
browser close # 关闭浏览器
快速示例
bash
browser navigate https://example.com
browser act "click the Sign In button"
browser extract "get the page title"
browser close
模式对比
Feature Local Browserbase 速度 更快 略慢 环境要求 需要本地 Chrome 需要 API Key 隐蔽模式 否 是 代理 / CAPTCHA 否 是 最佳使用场景 开发调试 生产 / 抓取 最佳实践
- 先
navigate再进行交互- 每条命令后查看截图以确认操作
- 动作描述尽量具体
- 使用完毕后记得
close浏览器故障排查
- Chrome 未找到:请安装 Chrome 或切换到 Browserbase 模式
- 操作失败:使用
browser observe探索可用元素- Browserbase 失效:检查 API Key 与 Project ID 是否配置正确
详细示例请参见EXAMPLES.md。API 参考请查看REFERENCE.md。