Agent Browser — 技能工具

Name: Agent Browser — 技能工具
Rating: 1 (2 reviews)
Author: bodietron

bodietron

Agent Browser — 技能工具

v1.0.0

无头浏览器自动化工具 CLI for AI agents. Use when interacting with websites — navigating pages, filling forms, clicking buttons, taking screenshots, ex...

2· 5,700·23 当前·23 累计

by @bodietron·MIT-0

浏览器自动化开发工具自动化智能体 AI模型访问

下载技能包

License

MIT-0

最后更新

2026/4/11

安全扫描

VirusTotal

可疑

查看报告

OpenClaw

可疑

medium confidence

该技能的功能（浏览器自动化）看似合理，但软件包省略了预期的运行时要求，并依赖用户运行的npm install在安装时获取代码；指令还允许读写本地文件并保存身份验证/状态，如果滥用可能暴露机密。

评估建议

此技能似乎实现了一个真实的浏览器自动化CLI，但在安装或运行之前需要检查几件事： - 来源：没有主页，注册表元数据给出未知来源。在运行npm install -g之前检查npm包'agent-browser'（版本作者、README和发布文件）。优先选择具有可验证仓库和维护者的包。 - 运行时要求不匹配：SKILL.md需要Node.js/npm，但注册表元数据未列出必需的二进制文件——确保您的环境满足工具的需求，并在运行安装脚本时保持谨慎。 - 数据暴露：该工具可以访问file:// URL、下载/上传文件、在页面上下文中执行JS，并将身份验证/状态保存到磁盘。除非您信任该包并已验证机密的存储位置/方式，否则不要向代理提供敏感凭证（密码、API密钥、私人令牌）。考虑使用专用测试账户。 - 安全安装：在隔离环境（容器、VM）中运行安装程序，使npm包及其安装脚本无法访问您的主主机。安装后，检查全局npm目录下的已安装文件。 - 强化：如果继续，请将AGENT_BROWSER_ALLOWED_DOMAINS设置为严格的允许列表，启用AGENT_BROWSER_CONTENT_B...

详细分析 ▾

ℹ 用途与能力

声明的目的——无头浏览器自动化——与描述的命令和功能（导航、点击/填写、截图、下载、状态持久化）匹配。然而SKILL.md和setup.sh声明需要Node.js/npm，而注册表元数据未列出必需的二进制文件或环境变量，这是用户应该注意的不一致之处。

⚠ 指令范围

运行时指令包括强大的操作：执行任意页面JS、连接到现有Chrome/CDP、打开file:// URI、上传和下载文件、保存/加载会话状态和身份验证配置文件，以及将页面文本重定向到文件。这些对于浏览器自动化工具是预期的，但也允许访问本地文件和代理访问的页面中可见的任何数据。SKILL.md示例引用$USERNAME/$PASSWORD，但该技能未声明必需的环境变量。

⚠ 安装机制

没有注册表安装规范；而是scripts/setup.sh执行npm install -g agent-browser，然后运行agent-browser install来获取Chromium。对于Node工具，在运行时从npm安装是正常的，但这意味着任意包代码将被下载并在主机上执行。包的来源是'未知'（没有主页），因此npm包的来源在元数据中未验证。

⚠ 凭证需求

该技能未声明必需的凭证或环境变量，但SKILL.md引用可选环境变量（AGENT_BROWSER_*），示例使用$USERNAME/$PASSWORD并保存身份验证配置文件和状态文件。该工具可以将凭证和cookie持久化到磁盘，并可能读取本地文件（file://、下载）。在元数据中不请求机密但指导使用和存储机密的工作流是不匹配的，并增加了风险。

ℹ 持久化与权限

该技能不始终启用，不请求提升的平台权限，但提供保存会话状态、存储身份验证配置文件和将文件写入磁盘的命令。这些行为对于浏览器自动化CLI是预期的，但意味着该技能可以在主机上创建包含敏感数据的持久产物。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv1.0.02026/2/27

Initial release — headless browser automation CLI for AI agents

● 可疑

安装命令点击复制

官方npx clawhub@latest install openclaw-agent-browser

镜像加速npx clawhub@latest install openclaw-agent-browser --registry https://cn.clawhub-mirror.com

技能文档

Setup

Run scripts/setup.sh to install agent-browser and Chromium. Requires Node.js.

Core Workflow

Every browser automation follows this pattern:

Navigate: agent-browser open
Snapshot: agent-browser snapshot -i (get element refs like @e1, @e2)
Interact: Use refs to click, fill, select
Re-snapshot: After navigation or DOM changes, get fresh refs

agent-browser open https://example.com/form agent-browser snapshot -i # Output: @e1 [input type="email"], @e2 [input type="password"], @e3 [button] "Submit"

agent-browser fill @e1 "user@example.com" agent-browser fill @e2 "password123" agent-browser click @e3 agent-browser wait --load networkidle agent-browser snapshot -i # Check result

Command Chaining

Chain with && when you don't need intermediate output:

agent-browser open https://example.com && agent-browser wait --load networkidle && agent-browser snapshot -i

Run separately when you need to parse output first (e.g., snapshot to discover refs).

Essential Commands

# Navigate agent-browser open agent-browser close # See the page (always do this first) agent-browser snapshot -i # Interactive elements with refs agent-browser snapshot -i -C # Include onclick divs # Interact using @refs agent-browser click @e1 agent-browser fill @e2 "text" agent-browser select @e1 "option" agent-browser press Enter agent-browser scroll down 500 # Get info agent-browser get text @e1 agent-browser get url agent-browser get title # Wait agent-browser wait @e1 # For element agent-browser wait --load networkidle # For network idle

# Capture agent-browser screenshot page.png agent-browser screenshot --full # Full page agent-browser pdf output.pdf

For the full command reference, see references/commands.md.

Ref Lifecycle (Important)

Refs (@e1, @e2) are invalidated when the page changes. Always re-snapshot after:

Clicking links/buttons that navigate
Form submissions
Dynamic content loading (dropdowns, modals)

Common Patterns

Form Submission

agent-browser open https://example.com/signup
agent-browser snapshot -i
agent-browser fill @e1 "Jane Doe"
agent-browser fill @e2 "jane@example.com"
agent-browser select @e3 "California"
agent-browser click @e5
agent-browser wait --load networkidle

Login with State Persistence

agent-browser open https://app.example.com/login agent-browser snapshot -i agent-browser fill @e1 "$USERNAME" && agent-browser fill @e2 "$PASSWORD" agent-browser click @e3 agent-browser wait --url "**/dashboard" agent-browser state save auth.json

# Reuse later agent-browser state load auth.json agent-browser open https://app.example.com/dashboard

Data Extraction

agent-browser open https://example.com/products
agent-browser snapshot -i
agent-browser get text @e5
agent-browser get text body > page.txt

Screenshot & Diff

agent-browser screenshot baseline.png
# ... changes happen ...
agent-browser diff screenshot --baseline baseline.png

Parallel Sessions

agent-browser --session site1 open https://site-a.com
agent-browser --session site2 open https://site-b.com
agent-browser session list

Security (Optional)

export AGENT_BROWSER_CONTENT_BOUNDARIES=1          # Wrap output for AI safety
export AGENT_BROWSER_ALLOWED_DOMAINS="example.com"  # Domain allowlist
export AGENT_BROWSER_MAX_OUTPUT=50000               # Prevent context flooding

Cleanup

Always close sessions when done: agent-browser close

Setup

Run scripts/setup.sh to install agent-browser and Chromium. Requires Node.js.

Core Workflow

Every browser automation follows this pattern:

Navigate: agent-browser open
Snapshot: agent-browser snapshot -i (get element refs like @e1, @e2)
Interact: Use refs to click, fill, select
Re-snapshot: After navigation or DOM changes, get fresh refs

agent-browser open https://example.com/form agent-browser snapshot -i # Output: @e1 [input type="email"], @e2 [input type="password"], @e3 [button] "Submit"

agent-browser fill @e1 "user@example.com" agent-browser fill @e2 "password123" agent-browser click @e3 agent-browser wait --load networkidle agent-browser snapshot -i # Check result

Command Chaining

Chain with && when you don't need intermediate output:

agent-browser open https://example.com && agent-browser wait --load networkidle && agent-browser snapshot -i

Run separately when you need to parse output first (e.g., snapshot to discover refs).

Essential Commands

# Navigate agent-browser open agent-browser close # See the page (always do this first) agent-browser snapshot -i # Interactive elements with refs agent-browser snapshot -i -C # Include onclick divs # Interact using @refs agent-browser click @e1 agent-browser fill @e2 "text" agent-browser select @e1 "option" agent-browser press Enter agent-browser scroll down 500 # Get info agent-browser get text @e1 agent-browser get url agent-browser get title # Wait agent-browser wait @e1 # For element agent-browser wait --load networkidle # For network idle

# Capture agent-browser screenshot page.png agent-browser screenshot --full # Full page agent-browser pdf output.pdf

For the full command reference, see references/commands.md.

Ref Lifecycle (Important)

Refs (@e1, @e2) are invalidated when the page changes. Always re-snapshot after:

Clicking links/buttons that navigate
Form submissions
Dynamic content loading (dropdowns, modals)

Common Patterns

Form Submission

agent-browser open https://example.com/signup
agent-browser snapshot -i
agent-browser fill @e1 "Jane Doe"
agent-browser fill @e2 "jane@example.com"
agent-browser select @e3 "California"
agent-browser click @e5
agent-browser wait --load networkidle

Login with State Persistence

agent-browser open https://app.example.com/login agent-browser snapshot -i agent-browser fill @e1 "$USERNAME" && agent-browser fill @e2 "$PASSWORD" agent-browser click @e3 agent-browser wait --url "**/dashboard" agent-browser state save auth.json

# Reuse later agent-browser state load auth.json agent-browser open https://app.example.com/dashboard

Data Extraction

agent-browser open https://example.com/products
agent-browser snapshot -i
agent-browser get text @e5
agent-browser get text body > page.txt

Screenshot & Diff

agent-browser screenshot baseline.png
# ... changes happen ...
agent-browser diff screenshot --baseline baseline.png

Parallel Sessions

agent-browser --session site1 open https://site-a.com
agent-browser --session site2 open https://site-b.com
agent-browser session list

Security (Optional)

export AGENT_BROWSER_CONTENT_BOUNDARIES=1          # Wrap output for AI safety
export AGENT_BROWSER_ALLOWED_DOMAINS="example.com"  # Domain allowlist
export AGENT_BROWSER_MAX_OUTPUT=50000               # Prevent context flooding

Cleanup

Always close sessions when done: agent-browser close

数据来源：ClawHub ↗ · 中文优化：龙虾技能库

OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险，如需更匹配、更安全的方案，建议联系付费定制

了解定制服务

License

运行时依赖

版本

安装命令 点击复制

技能文档

Setup

Core Workflow

Command Chaining

Essential Commands

Ref Lifecycle (Important)

Common Patterns

Form Submission

Login with State Persistence

Data Extraction

Screenshot & Diff

Parallel Sessions

Security (Optional)

Cleanup

Setup

Core Workflow

Command Chaining

Essential Commands

Ref Lifecycle (Important)

Common Patterns

Form Submission

Login with State Persistence

Data Extraction

Screenshot & Diff

Parallel Sessions

Security (Optional)

Cleanup

安装命令点击复制