axiv-html-cn-static 的翻译是：axiv 的 HTML 中文静态版本

v1.0.0

此技能应在需要将arXiv论文HTML页面转换为本地中文静态HTML网页时使用，保留本地图像、图标、CSS...

0· 0·0 当前·0 累计

by @zhengyaofang (Nineve)

国内服务

使用场景：国内平台操作中文内容处理

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install axiv-html-cn-static

镜像加速npx clawhub@latest install axiv-html-cn-static --registry https://cn.longxiaskill.com镜像同步中

本土化适配说明

axiv-html-cn-static 的翻译是：axiv 的 HTML 中文静态版本安装说明：安装命令：["openclaw skills install axiv-html-cn-static"] 该技能用于国内通用相关操作，可能需要相应的平台账号或API密钥

需要定制？告诉我你的需求 →

技能文档

arXiv 中文静态 HTML 网页生成技能目标将 arXiv 英文论文 HTML 实验版转换为本地可打开的中文静态 HTML 网页。保留论文标题、元数据、章节结构、公式文本、图片、图表、图标和 CSS 资源。中文正文可复用 arxiv-paper-resolver 的章节提取与中文 Markdown 生成流程。

触发场景在以下请求中使用本技能：将 arXiv 英文论文 HTML 转为中文 HTML 网页。将 arXiv 论文做成本地静态网页、离线网页或中文网页。要求保留 arXiv HTML 中的图片、图表、图标、CSS 或版式资源。已有 arxiv-paper-resolver 生成的中文 Markdown，希望进一步生成本地 index.html。

资源 scripts/arxiv_html_static_builder.py：下载 arXiv HTML、PDF、图片、图标、CSS 等本地资源，并把中文 Markdown 包装为静态 HTML。 scripts/requirements.txt：脚本依赖。 references/output_contract.md：输出目录、文件命名和质量检查约定。

工作流程 Step 1：确认 arXiv ID 若用户提供的是 arXiv URL 或裸 ID，直接使用。若只提供 PDF 路径或论文标题，先根据标题搜索 arXiv，确认 abs 页面与 ID。

Step 2：优先复用 arxiv-paper-resolver 生成中文 Markdown 若当前目录已有 {arxiv_id}_中文文档.md，直接复用。若没有中文 Markdown，先使用 arxiv-paper-resolver：运行其章节提取脚本，获得 {arxiv_id}_raw_sections/、{arxiv_id}_metadata.json、{arxiv_id}_section_structure.txt。读取原文章节，翻译为中文 Markdown。保持公式为 $...$，避免使用 $...$ 或带反引号的公式定界符。去除参考文献引用标记和 References/Appendix 正文，除非用户明确要求保留。

Step 3：准备本地 HTML 资源安装依赖后运行： python3 -m pip install -r scripts/requirements.txt python3 scripts/arxiv_html_static_builder.py prepare -o 该步骤会：拉取 arXiv abs 元数据。获取 arXiv HTML 实验版。下载 PDF。下载并本地化 HTML 中的图片、图表、图标、CSS、CSS 中引用的资源。生成本地化英文 HTML 副本。提取图表清单，记录图表所属章节。

Step 4：构建中文静态 HTML 使用已有中文 Markdown 构建网页： python3 scripts/arxiv_html_static_builder.py build --md _中文文档.md 默认输出： /index.html 构建时将：将中文 Markdown 转为静态 HTML。将 arXiv HTML 中的 figure 与 table 节点作为完整 HTML 块插入，因此表格不会只剩 caption。清理 arXiv 表格中的固定 height、width、transform 与 LaTeXML 缩放包裹，改用 .table-scroll 横向滚动容器，确保宽表格横向可滚、纵向完整展开。优先按正文中出现的 Figure N / Table N / 图N / 表N 引用插入图表；若中文 Markdown 中没有显式引用，则按原文图表在该章节中的顺序分布到章节内部，而不是统一放在章节开头。使用本地 CSS 样式生成适合阅读的中文论文网页。保持所有图片和图表引用为本地相对路径。默认引入 MathJax CDN 渲染 $...$、$$...$$、$...$、\[...\] 公式；完全离线环境下可改为本地 MathJax/KaTeX 资源。

Step 5：质量检查完成后检查： grep -nE 'https?://arxiv.org|https?://static' /index.html | head find /assets -type f | head 要求： index.html 能通过浏览器本地打开。论文中的图片、图表、图标资源存在于 assets/。 HTML 正文为中文。公式保持 $...$ 文本形式，不改写 LaTeX 命令。不依赖远程 arXiv 图片资源；若仍有远程链接，只允许作为论文链接、arXiv 链接或外部引用链接存在。

输出目录结构标准输出结构： {output_parent_dir}/{paper-title-slug}/ ├── index.html # 中文静态网页 ├── {arxiv_id}.pdf # PDF ├── {arxiv_id}_original_local.html # 本地化英文 HTML 副本 ├── {arxiv_id}_static_metadata.json # 静态网页元数据 ├── {arxiv_id}_asset_manifest.json # 资源下载清单 ├── {arxiv_id}_figures.json # 图表清单 ├── {arxiv_id}_中文文档.md # arxiv-paper-resolver 生成或复用的中文 Markdown └── assets/ # 本地图片、图标、CSS 等资源

注意事项保持 arxiv-paper-resolver 与本技能职责分离：前者负责章节抽取和中文正文生成，后者负责 HTML 资源本地化与静态网页构建。对图表采用“按章节插入”的保守策略；若用户要求与原文完全同位插图，需要人工/LLM 根据原文 HTML 进一步调整图表位置。不把外部 CDN 作为必要依赖，确保 index.html 尽量可离线阅读。若 arXiv HTML 实验版不存在，报告无法生成 HTML 静态页，并建议退回 PDF/LaTeX 解析路线。

数据来源：ClawHub ↗ · 中文优化：龙虾技能库