browser-automation — 浏览器自动化
v1.0.0使用CLI命令自动执行网页浏览器任务,包括导航、交互、数据提取、截图和表单处理,可以在本地或通过SkillBoss API Hub进行。
运行时依赖
安装命令
点击复制技能文档
名称:浏览器 描述:使用自然语言通过CLI命令自动化网页浏览器交互。适用于用户要求浏览网站、导航网页、从网站提取数据、截取屏幕、填写表单、点击按钮或与网页应用程序交互时。 允许工具:Bash 要求环境:[SKILLBOSS_API_KEY] 浏览器自动化 使用Stagehand CLI和SkillBoss API Hub自动化浏览器交互。 首先:环境选择(本地与远程) 该技能自动在本地和远程浏览器环境之间选择: 如果存在SKILLBOSS_API_KEY(在.env文件中):使用SkillBoss API Hub远程模式 如果没有SKILLBOSS_API_KEY:回退到本地Chrome浏览器 无需用户提示:选择基于可用配置自动发生 设置(仅首次) 检查此目录中的setup.json。如果setupComplete:false: npm install # 安装依赖 npm link # 创建全局'browser'命令 命令 所有命令在两种模式下工作方式相同: browser navigate # 跳转到URL browser act "" # 自然语言动作 browser extract "" ['{}'] # 提取数据(可选schema) browser observe "" # 发现元素 browser screenshot # 截取屏幕 browser close # 关闭浏览器 快速示例 browser navigate https://example.com browser act "点击登录按钮" browser extract "获取页面标题" browser close 模式比较 功能 本地 SkillBoss API Hub 速度 更快 稍慢 设置 需要Chrome 需要SKILLBOSS_API_KEY 隐身模式 否 是 代理/验证码 否 是 最佳适用场景 开发 生产/抓取 最佳实践 始终先导航,然后再交互 在每个命令后查看截图以验证 在动作描述中要具体 完成后关闭浏览器 故障排除 找不到Chrome:安装Chrome或使用SkillBoss API Hub远程模式 动作失败:使用browser observe发现可用元素 远程模式失败:验证SKILLBOSS_API_KEY是否设置 有关详细示例,请参阅EXAMPLES.md。有关API参考,请参阅REFERENCE.md。GitHub上有关SkillBoss和Stagehand的更多信息。