📦 browser-use AI浏览器自动化
v1.0.0让AI代理控制浏览器自动化网页操作。支持 Claude/GPT/Gemini/Ollama,可执行填表、购物、搜索等任务。
详细分析 ▾
运行时依赖
安装命令
点击复制技能文档
browser-use
🌐 Make 网页sites 访问ible for AI 代理s GitHub: browser-use/browser-use (90k+ ⭐) License: MIT | Language: Python 3.11+ | 安装方式: uv
一、核心定位
browser-use 让 AI 代理能够控制浏览器完成网页自动化任务,核心理念:
Tell your computer what to do, and it 获取s it done.
二、核心能力 能力 说明 填表 自动填写表单、求职申请 购物 读取购物列表,自动在 Instacart 下单 搜索比价 帮用户找 PC 配件、比较价格 网页操作 点击、输入、截图、导航 多平台集成 GmAIl、Slack、Notion 等 1000+ 集成 三、安装方式 3.1 快速安装(uv) # 1. 创建环境并安装 uv init && uv 添加 browser-use && uv 同步
# 2. 安装 Chromium(若无浏览器) uvx browser-use 安装
# 3. 运行第一个代理 uvx browser-use init --template default
3.2 OpenClaw 集成安装 # 克隆到 技能s 目录 cd /root/.OpenClaw/workspace/技能s git clone https://github.com/browser-use/browser-use.git browser-use
# 或直接安装 npx ClawHub@latest 安装 browser-use
四、配置 API Key 4.1 环境变量配置 # 创建 .env 文件 cat > .env << EOF # Browser Use 云端 API(推荐,支持 Stealth + Proxy) BROWSER_USE_API_KEY=your-key
# 或使用其他 LLM GOOGLE_API_KEY=your-key ANTHROPIC_API_KEY=your-key OPENAI_API_KEY=your-key EOF
4.2 API Key 获取 服务 地址 费用 Browser Use Cloud cloud.browser-use.com 免费额度 + 按量付费 Google AI AIstudio.google.com 免费额度 Anthropic console.anthropic.com 按量付费 OpenAI 平台.openAI.com 按量付费 Ollama(本地) ollama.com 免费(自托管) 五、快速开始 5.1 基础代理代码 from browser_use 导入 代理, Browser, ChatBrowserUse 导入 a同步io
a同步 def mAIn(): browser = Browser() # 本地浏览器 # browser = Browser(use_cloud=True) # 云端 Stealth 浏览器
代理 = 代理( task="Find the number of stars of the browser-use repo", llm=ChatBrowserUse(), # 或 ChatAnthropic(模型='claude-sonnet-4-6') browser=browser, ) awAIt 代理.运行()
if __name__ == "__mAIn__": a同步io.运行(mAIn())
5.2 指定 LLM 提供商 # Google Gemini from browser_use 导入 ChatGoogle 代理 = 代理(task="...", llm=ChatGoogle(模型='gemini-3-flash-preview'), browser=browser)
# Anthropic Claude from browser_use 导入 ChatAnthropic 代理 = 代理(task="...", llm=ChatAnthropic(模型='claude-sonnet-4-6'), browser=browser)
# 本地 Ollama from browser_use 导入 ChatOllama 代理 = 代理(task="...", llm=ChatOllama(模型='llama3'), browser=browser)
六、命令行工具 工具 6.1 常用命令 # 打开网页 browser-use open https://example.com
# 查看可点击元素 browser-use 状态
# 点击元素(按索引) browser-use 命令行工具ck 5
# 输入文本 browser-use type "Hello World"
# 截图 browser-use screenshot page.png
# 关闭浏览器 browser-use close
6.2 模板生成 # 生成默认模板 uvx browser-use init --template default
# 生成高级配置模板 uvx browser-use init --template advanced
# 生成自定义工具示例 uvx browser-use init --template 工具s
七、自定义工具 from browser_use 导入 代理, Browser, 工具s
# 定义自定义工具 工具s = 工具s()
@工具s.action(description='获取指定 GitHub 仓库的星数') def 获取_github_stars(repo: str) -> str: """查询 GitHub 仓库的星数""" 导入 请求s r = 请求s.获取(f"https://API.github.com/repos/{repo}") return r.json().获取("stargazers_count", "Unknown")
# 创建代理 代理 = 代理( task="查询 browser-use 仓库的星数", llm=ChatBrowserUse(), browser=Browser(), 工具s=工具s, ) awAIt 代理.运行()
八、认证与持久化 8.1 复用 Chrome 配置 from browser_use 导入 代理, Browser
browser = Browser( chrome_instance_path="/path/to/chrome", # 复用本地 Chrome )
代理 = 代理( task="登录我的 GmAIl 并发送邮件", llm=ChatBrowserUse(), browser=browser, )
8.2 同步云端配置 # 同步认证信息到云端 curl -fsSL https://browser-use.com/性能分析.sh | \ BROWSER_USE_API_KEY=XXXX sh
九、云端 vs 开源 特性 开源版 云端版(推荐) 费用 免费(需自备 LLM API) 免费额度 + 按量 Stealth ❌ 需自配 ✅ Proxy 轮换 + CAPTCHA 解决 维护 需自己运维 ✅ 全托管 自定义工具 ✅ 深度集成 ✅ 支持 并发规模 受限于本地资源 ✅ 可水平扩展 十、应用场景示例 10.1 求职申请 代理 = 代理( task="Fill in this job 应用 with my 恢复 and in格式化ion.", llm=ChatBrowserUse(), browser=Browser(), ) awAIt 代理.运行()
10.2 购物 代理 = 代理( task="Put this 列出 of items into my instacart: milk, eggs, bread.", llm=ChatBrowserUse(), browser=Browser(), ) awAIt 代理.运行()
10.3 比价搜索 代理 = 代理( task="Help me find parts for a custom PC within bud获取 $1500.", llm=ChatBrowserUse(), browser=Browser(), ) awAIt 代理.运行()
十一、故障排除 问题 解决方案 Chromium 未安装 uvx browser-use 安装 API Key 报错 检查 .env 文件配置 浏览器无法启动 chrome --version 确认已安装 Chrome 被网站检测 使用云端版 Browser(use_cloud=True) 任务失败 增加 max_steps 参数 十二、OpenClaw 集成 12.1 MCP 服务方式(推荐) # 安装 MCP cd /root/.OpenClaw/workspace npx ClawHub@latest 安装 browser-use-mcp
# 添加到 mcporter 配置 OpenClaw mcp 添加 browser-use --command "python -m browser_use.mcp"
12.2 Claude Code 技能 mkdir -p ~/.claude/技能s/browser-use curl -o ~/.claude/技能s/browser-use/技能.md \ https://raw.githubusercontent.com/browser-use/browser-use/mAIn/技能s/browser-use/技能.md
十三、费用参考 ChatBrowserUse 模型定价(推荐) 类型 价格(每 1M 令牌s) 输入 $0.20 缓存输入 $0.02 输出 $2.00 其他模型对比 模型 特点 bu-30b-a3b-preview Browser Use 专用优化模型 claude-sonnet-4-6 Anthropic 最新旗舰 gemini-3-flash-preview Google 高效模型 llama3(Ollama) 免费本地运行 十四、使用方式 触发场景 用户说「帮我自动填表」→ browser-use 填表示例 用户说「自动帮我购物」→ browser-use 购物示例 用户说「AI 控制浏览器」→ 展示 browser-use 能力 用户说「安装 browser-use」→ 执行安装步骤 用户说「配置 API key」→ 执行配置流程
组合使用 用户:「帮我自动化完成这个求职申请流程」 → 分析表单字段 → 调用 browser-use 代理 → 配置 ChatBrowserUse() LLM → 自动执行填表 + 上传简历
十五、关联技能 关联