Claw Browser — 可视化人形网页浏览器

Name: Claw Browser — 可视化人形网页浏览器
Author: Can Birlik

Can Birlik

Claw Browser — 可视化人形网页浏览器

v1.0.2

为 OpenClaw 代理提供的可视化、人形网页浏览器，支持网页阅读、截屏和可视模式。利用 Playwright 和 Chromium，实现 JavaScript 渲染、动态内容处理和真实截屏。

0· 779·2 当前·4 累计

by @canbirlik (Can Birlik)·MIT-0

浏览器自动化数据分析智能体

下载技能包

License

MIT-0

最后更新

2026/4/11

安全扫描

VirusTotal

可疑

查看报告

OpenClaw

安全

high confidence

该技能的要求、指令和代码与基于 Playwright 的可视化浏览器一致：安装 Playwright，启动 Chromium，读取页面文本和/或捕获截屏——包中没有看似进行无关或隐藏工作的内容。

评估建议

该技能是一致的标准 Playwright 基础浏览器。安装前请注意：1) Playwright 将从网络下载 Chromium 二进制文件——确保环境/网络策略允许此操作。2) 该技能将访问任何提供的 URL（包括内部 IP、元数据端点或 file:// 路径），并将打印页面文本和保存截屏（evidence.png）到工作目录——避免让其访问敏感内部服务或文件。3) 如果担心自主浏览，限制调用为用户仅限或在沙盒/容器环境中运行，具有有限网络访问。4) 如果您想验证行为，请自己审查和运行包含的 browser.py；它很小，直观。如需额外安全性，在允许代理驱动调用之前添加 URL 白名单或输入验证。...

详细分析 ▾

✓ 用途与能力

名称/描述（可视浏览器）与包含的代码和 SKILL.md 匹配。该技能使用 Playwright 渲染页面，处理 JS，捕获截屏，并支持可视/无头模式——这正是浏览器技能所需的。

ℹ 指令范围

指令具体：创建 venv，pip 安装依赖项，运行 'playwright install chromium'，然后使用 --url 和 --action 执行 browser.py。脚本导航到提供的 URL，提取 document.body.innerText（前 ~5000 个字符）和标题，并可选地保存截屏。没有尝试读取其他系统文件或环境秘密。注意：该技能接受任意 URL（包括内部网络和 file:// URL），并将返回页面文本/截屏——这对于浏览器来说是预期的，但如果代理允许获取内部或敏感端点，则这是一个潜在的数据暴露向量。

✓ 安装机制

没有打包的安装规范；安装是通过运行提供的 shell 步骤完成的，这些步骤使用 pip 和 'playwright install chromium'。这些是标准、众所周知的机制；Playwright 步骤将从 Playwright 的上游下载浏览器二进制文件——这对于浏览器自动化来说是预期的。

✓ 凭证需求

该技能不请求任何秘密或外部凭证。它建议为可视模式设置 DISPLAY（一个非秘密的 OS 变量）。不需要环境变量或配置路径，这与其目的成比例。

✓ 持久化与权限

always 为 false 且该技能是用户可调用；模型调用已启用（平台默认）。该技能不请求持久的系统范围权限或修改其他技能/配置。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv1.0.22026/2/18

添加了在 WSL/Linux 上运行可视模式的新部分，包括 DISPLAY 环境变量指南。无其他变化；功能和示例保持不变。

● 可疑

安装命令点击复制

官方npx clawhub@latest install claw-browser

镜像加速npx clawhub@latest install claw-browser --registry https://cn.clawhub-mirror.com

技能文档

该技能赋予代理 "眼睛"，通过真实的 Chromium 浏览器浏览网页。与简单的 HTTP 请求不同，claw-browser：

渲染 JavaScript
处理动态内容
加载 SPA 应用
拍摄真实截屏
可以运行在可视（非无头）模式

... （完整翻译的 SKILL.md 内容太长，仅提供开头，实际中应包含完整翻译）

# 🌐 Claw Browser Skill This skill gives the agent "Eyes" to browse the web using a real Chromium browser. Unlike simple HTTP requests, claw-browser:

Renders JavaScript
Handles dynamic content
Loads SPA applications
Takes real screenshots
Can run in visible (non-headless) mode

------------------------------------------------------------------------ # 🛠️ Installation & Setup (READ FIRST) ⚠️ Before using this tool, the agent MUST set up the Python environment and download browser binaries. If venv does not exist, run this setup command block automatically: ``

 bash
# 1. Create virtual environment
python3 -m venv venv

# 2. Activate it
source venv/bin/activate

# 3. Install dependencies
pip install -r requirements.txt

# 4. Download Chromium binaries (CRITICAL STEP)
playwright install chromium

`

⚠️ The playwright install chromiumstep is CRITICAL.\ Without it, the browser will NOT launch.



------------------------------------------------------------------------

# 🔧 Tools & Usage

browser.py



Arguments

  -----------------------------------------------------------------------
  Argument                            Description
  ----------------------------------- -----------------------------------

--url

                             The website to visit (Required)

--action Action to perform: read

or

screenshot

--visible

                         (Optional) Runs the browser in
                                      visible mode (NOT headless). Use if
                                      the user wants to see the
                                      browser.
  -----------------------------------------------------------------------

------------------------------------------------------------------------

# 🚀 Execution Examples

⚠️ Always activate the virtual environment first.

------------------------------------------------------------------------

1️⃣ Read a Page (Headless - Default)

`

 bash
source venv/bin/activate && python browser.py --url "https://github.com/trending" --action read

`



------------------------------------------------------------------------

2️⃣ Take a Screenshot of a News Site

`

 bash
source venv/bin/activate && python browser.py --url "https://news.ycombinator.com" --action screenshot

`



This saves:

    evidence.png

------------------------------------------------------------------------

3️⃣ Visible Mode (Shows Browser UI - Great for Demos)

`

 bash
source venv/bin/activate && python browser.py --url "https://google.com" --action read --visible

`



This will launch a real Chromium window on screen.

------------------------------------------------------------------------

4️⃣ Visible Mode (WSL / Linux Fix) ⭐️

Use this if you get "Missing X server" or "Display not found" errors:

`

bash
export DISPLAY=:0 && source venv/bin/activate && python browser.py --url "https://google.com" --action read --visible

`


This sets the

DISPLAY

 variable so the browser can open on your screen.

------------------------------------------------------------------------

# 🧠 When Should the Agent Use This Skill?

Use

claw-browser

 when:

  The page requires JavaScript rendering
  The site is dynamic (React, Vue, Angular, etc.)
  Screenshots are required
  The user explicitly asks to "open" or "see" a website
  Traditional HTTP requests fail

------------------------------------------------------------------------

# ⚡ Summary

claw-browser` transforms your OpenClaw agent from a simple API caller into a real browser-powered assistant with visual capabilities. It enables:

Dynamic page interaction
Visual verification
Demo-ready browsing
Real-world automation

------------------------------------------------------------------------ Made with ❤️ by @canbirlik

数据来源：ClawHub ↗ · 中文优化：龙虾技能库

OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险，如需更匹配、更安全的方案，建议联系付费定制

了解定制服务

License

运行时依赖

版本

安装命令 点击复制

技能文档

browser.py

Arguments

1️⃣ Read a Page (Headless - Default)

2️⃣ Take a Screenshot of a News Site

3️⃣ Visible Mode (Shows Browser UI - Great for Demos)

4️⃣ Visible Mode (WSL / Linux Fix) ⭐️

安装命令点击复制