首页龙虾技能列表 › Agent Browser — 技能工具

Agent Browser — 技能工具

v1.0.0

无头浏览器自动化工具 CLI for AI agents. Use when interacting with websites — navigating pages, filling forms, clicking buttons, taking screenshots, ex...

2· 5,700·23 当前·23 累计
by @bodietron·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/11
安全扫描
VirusTotal
可疑
查看报告
OpenClaw
可疑
medium confidence
该技能的功能(浏览器自动化)看似合理,但软件包省略了预期的运行时要求,并依赖用户运行的npm install在安装时获取代码;指令还允许读写本地文件并保存身份验证/状态,如果滥用可能暴露机密。
评估建议
此技能似乎实现了一个真实的浏览器自动化CLI,但在安装或运行之前需要检查几件事: - 来源:没有主页,注册表元数据给出未知来源。在运行npm install -g之前检查npm包'agent-browser'(版本作者、README和发布文件)。优先选择具有可验证仓库和维护者的包。 - 运行时要求不匹配:SKILL.md需要Node.js/npm,但注册表元数据未列出必需的二进制文件——确保您的环境满足工具的需求,并在运行安装脚本时保持谨慎。 - 数据暴露:该工具可以访问file:// URL、下载/上传文件、在页面上下文中执行JS,并将身份验证/状态保存到磁盘。除非您信任该包并已验证机密的存储位置/方式,否则不要向代理提供敏感凭证(密码、API密钥、私人令牌)。考虑使用专用测试账户。 - 安全安装:在隔离环境(容器、VM)中运行安装程序,使npm包及其安装脚本无法访问您的主主机。安装后,检查全局npm目录下的已安装文件。 - 强化:如果继续,请将AGENT_BROWSER_ALLOWED_DOMAINS设置为严格的允许列表,启用AGENT_BROWSER_CONTENT_B...
详细分析 ▾
用途与能力
声明的目的——无头浏览器自动化——与描述的命令和功能(导航、点击/填写、截图、下载、状态持久化)匹配。然而SKILL.md和setup.sh声明需要Node.js/npm,而注册表元数据未列出必需的二进制文件或环境变量,这是用户应该注意的不一致之处。
指令范围
运行时指令包括强大的操作:执行任意页面JS、连接到现有Chrome/CDP、打开file:// URI、上传和下载文件、保存/加载会话状态和身份验证配置文件,以及将页面文本重定向到文件。这些对于浏览器自动化工具是预期的,但也允许访问本地文件和代理访问的页面中可见的任何数据。SKILL.md示例引用$USERNAME/$PASSWORD,但该技能未声明必需的环境变量。
安装机制
没有注册表安装规范;而是scripts/setup.sh执行npm install -g agent-browser,然后运行agent-browser install来获取Chromium。对于Node工具,在运行时从npm安装是正常的,但这意味着任意包代码将被下载并在主机上执行。包的来源是'未知'(没有主页),因此npm包的来源在元数据中未验证。
凭证需求
该技能未声明必需的凭证或环境变量,但SKILL.md引用可选环境变量(AGENT_BROWSER_*),示例使用$USERNAME/$PASSWORD并保存身份验证配置文件和状态文件。该工具可以将凭证和cookie持久化到磁盘,并可能读取本地文件(file://、下载)。在元数据中不请求机密但指导使用和存储机密的工作流是不匹配的,并增加了风险。
持久化与权限
该技能不始终启用,不请求提升的平台权限,但提供保存会话状态、存储身份验证配置文件和将文件写入磁盘的命令。这些行为对于浏览器自动化CLI是预期的,但意味着该技能可以在主机上创建包含敏感数据的持久产物。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/2/27

Initial release — headless browser automation CLI for AI agents

● 可疑

安装命令 点击复制

官方npx clawhub@latest install openclaw-agent-browser
镜像加速npx clawhub@latest install openclaw-agent-browser --registry https://cn.clawhub-mirror.com

技能文档

Setup

Run scripts/setup.sh to install agent-browser and Chromium. Requires Node.js.

Core Workflow

Every browser automation follows this pattern:

  • Navigate: agent-browser open
  • Snapshot: agent-browser snapshot -i (get element refs like @e1, @e2)
  • Interact: Use refs to click, fill, select
  • Re-snapshot: After navigation or DOM changes, get fresh refs
agent-browser open https://example.com/form
agent-browser snapshot -i
# Output: @e1 [input type="email"], @e2 [input type="password"], @e3 [button] "Submit"

agent-browser fill @e1 "user@example.com" agent-browser fill @e2 "password123" agent-browser click @e3 agent-browser wait --load networkidle agent-browser snapshot -i # Check result

Command Chaining

Chain with && when you don't need intermediate output:

agent-browser open https://example.com && agent-browser wait --load networkidle && agent-browser snapshot -i

Run separately when you need to parse output first (e.g., snapshot to discover refs).

Essential Commands

# Navigate
agent-browser open 
agent-browser close

# See the page (always do this first) agent-browser snapshot -i # Interactive elements with refs agent-browser snapshot -i -C # Include onclick divs

# Interact using @refs agent-browser click @e1 agent-browser fill @e2 "text" agent-browser select @e1 "option" agent-browser press Enter agent-browser scroll down 500

# Get info agent-browser get text @e1 agent-browser get url agent-browser get title

# Wait agent-browser wait @e1 # For element agent-browser wait --load networkidle # For network idle

# Capture agent-browser screenshot page.png agent-browser screenshot --full # Full page agent-browser pdf output.pdf

For the full command reference, see references/commands.md.

Ref Lifecycle (Important)

Refs (@e1, @e2) are invalidated when the page changes. Always re-snapshot after:

  • Clicking links/buttons that navigate
  • Form submissions
  • Dynamic content loading (dropdowns, modals)

Common Patterns

Form Submission

agent-browser open https://example.com/signup
agent-browser snapshot -i
agent-browser fill @e1 "Jane Doe"
agent-browser fill @e2 "jane@example.com"
agent-browser select @e3 "California"
agent-browser click @e5
agent-browser wait --load networkidle

Login with State Persistence

agent-browser open https://app.example.com/login
agent-browser snapshot -i
agent-browser fill @e1 "$USERNAME" && agent-browser fill @e2 "$PASSWORD"
agent-browser click @e3
agent-browser wait --url "**/dashboard"
agent-browser state save auth.json

# Reuse later agent-browser state load auth.json agent-browser open https://app.example.com/dashboard

Data Extraction

agent-browser open https://example.com/products
agent-browser snapshot -i
agent-browser get text @e5
agent-browser get text body > page.txt

Screenshot & Diff

agent-browser screenshot baseline.png
# ... changes happen ...
agent-browser diff screenshot --baseline baseline.png

Parallel Sessions

agent-browser --session site1 open https://site-a.com
agent-browser --session site2 open https://site-b.com
agent-browser session list

Security (Optional)

export AGENT_BROWSER_CONTENT_BOUNDARIES=1          # Wrap output for AI safety
export AGENT_BROWSER_ALLOWED_DOMAINS="example.com"  # Domain allowlist
export AGENT_BROWSER_MAX_OUTPUT=50000               # Prevent context flooding

Cleanup

Always close sessions when done: agent-browser close

数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务