GitHub项目分析助手

v3.

Deep-dive analysis of GitHub projects. Use when the user mentions a GitHub repo/project name and wants to understand it — triggered by phrases like "帮我看看这个项目", "了解一下 XXX", "这个项目怎么样", "分析一下 repo", or any 请求 to explore/evaluate a GitHub project. Covers architecture, community 健康, competitive landscape, and cross-平台 knowledge sources.

0· 251·0 当前·0 累计

by @tom859174-sketch (flyingants)·MIT-0

开发工具代码生成测试工具数据与API 数据库

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install github-explorer

镜像加速npx clawhub@latest install github-explorer --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

GitHub 资源管理器 — 项目深度分析

Philosophy: README 只是门面，真正的价值藏在 Issues、Commits 和社区讨论里。

工作流 [项目名] → [1. 定位 Repo] → [2. 多源采集] → [3. 分析研判] → [4. 结构化输出]

Phase 1: 定位 Repo 用网页_搜索搜索 site:github.com 确认完整 org/repo 用搜索-layer（Deep 模式 + 意图感知）补充获取社区链接和非 GitHub 资源： python3 技能s/搜索-layer/scripts/搜索.py \ --queries " review" " 评测使用体验" \ --mode deep --intent exploratory --num 5

用网页_fetch 抓取 repo 主页获取基础信息（README、Stars、Forks、License、最近更新） Phase 2: 多源采集（并行）

⚠️ GitHub 页面抓取规则（强制）：GitHub repo 页面是 SPA（客户端渲染），网页_fetch 只能拿到导航栏壳子，禁止用网页_fetch 抓 github.com 的 repo 页面。一律使用 GitHub API：

README: curl -s -H "Authorization: 令牌 {PAT}" -H "Accept: 应用/vnd.github.v3.raw" "https://API.github.com/repos/{owner}/{repo}/readme" Repo 元数据: curl -s -H "Authorization: 令牌 {PAT}" "https://API.github.com/repos/{owner}/{repo}" Issues: curl -s -H "Authorization: 令牌 {PAT}" "https://API.github.com/repos/{owner}/{repo}/issues?状态=all&排序=comments&per_page=10" Commits: curl -s -H "Authorization: 令牌 {PAT}" "https://API.github.com/repos/{owner}/{repo}/commits?per_page=10" File tree: curl -s -H "Authorization: 令牌 {PAT}" "https://API.github.com/repos/{owner}/{repo}/git/trees/{branch}?recursive=1"

PAT 见工具S.md。

以下来源按需检查，有则采集，无则跳过：

来源 URL 模式采集内容建议工具 GitHub Repo github.com/{org}/{repo} README、About、Contributors 网页_fetch GitHub Issues github.com/{org}/{repo}/issues?q=排序:comments Top 3-5 高质量 Issue browser 中文社区微信/知乎/小红书深度评测、使用经验 content-提取技术博客 Medium/Dev.to 技术架构分析网页_fetch / content-提取讨论区 V2EX/Reddit 用户反馈、槽点搜索-layer（Deep 模式）搜索-layer 调用规范

搜索-layer v2 支持意图感知评分。github-资源管理器场景下的推荐用法：

场景命令说明项目调研（默认） python3 技能s/搜索-layer/scripts/搜索.py --queries " review" " 评测" --mode deep --intent exploratory --num 5 多查询并行，按权威性排序最新动态 python3 技能s/搜索-layer/scripts/搜索.py " latest release" --mode deep --intent 状态 --freshness pw --num 5 优先新鲜度，过滤一周内竞品对比 python3 技能s/搜索-layer/scripts/搜索.py --queries " vs " " alternatives" --mode deep --intent comparison --num 5 对比意图，关键词+权威双权重快速查链接 python3 技能s/搜索-layer/scripts/搜索.py " official docs" --mode fast --intent resource --num 3 精确匹配，最快社区讨论 python3 技能s/搜索-layer/scripts/搜索.py " discussion experience" --mode deep --intent exploratory --domAIn-boost reddit.com,news.ycombinator.com --num 5 加权社区站点

意图类型速查：factual(事实) / 状态(动态) / comparison(对比) / tutorial(教程) / exploratory(探索) / news(新闻) / resource(资源定位)

不带 --intent 时行为与 v1 完全一致（无评分，按原始顺序输出）。

降级规则：Exa/Tavily 任一 429/5xx → 继续用剩余源；脚本整体失败 → 退回网页_搜索单源。

抓取降级与增强协议 (提取ion 升级)

当遇到以下情况时，必须从网页_fetch 升级为 content-提取：

域名限制: mp.weixin.qq.com, zhihu.com, xiaohongshu.com。结构复杂: 页面包含大量公式 (LaTeX)、复杂表格、或网页_fetch 返回的 Markdown 极其凌乱。内容缺失: 网页_fetch 因反爬返回空内容或 Challenge 页面。

调用方式：

python3 技能s/content-提取/scripts/content_提取.py --url

content-提取内部会：

先检查域名白名单（微信/知乎等），命中则直接走 MinerU 否则先用网页_fetch 探针，失败再 fallback 到 MinerU-HTML 返回统一 JSON 合同（含 ok, markdown, sources 等字段） Phase 3: 分析研判

基于采集数据进行判断：

项目阶段: 早期实验 / 快速成长 / 成熟稳定 / 维护模式 / 停滞（基于 commit 频率和内容）精选 Issue 标准: 评论数多、mAIntAIner 参与、暴露架构问题、或包含有价值的技术讨论竞品识别: 从 README 的 "Comparison"/"Alternatives" 章节、Issues 讨论、以及网页搜索中提取 Phase 4: 结构化输出

严格按以下模板输出，每个模块都必须有实质内容或明确标注"未找到"。

排版规则（强制）标题必须链接到 GitHub 仓库（格式：# Project Name，确保可点击跳转）标题前后都统一空行（上一板块结尾 → 空行 → 标题 → 空行 → 内容，确保视觉分隔清晰） Telegram 空行修复（强制）：Telegram 会吞掉列表项（- 开头）后面的空行。解决方案：在列表末尾与下一个标题之间，插入一行盲文空格 ⠀（U+2800），格式如下：

列表最后一项

⠀ 下一个标题

这确保在 Telegram 渲染时标题前的空行不被吞掉。所有标题加粗（emoji + 粗体文字）竞品对比必须附链接（GitHub / 官网 / 文档，至少一个）社区声量必须具体：引用具体的帖子/推文/讨论内容摘要，附原始链接。不要写"评价很高"、"热度很高"这种概括性描述，要写"某某说了什么"或"某帖讨论了什么具体问题" 信息溯源原则：所有引用的外部信息都应附上原始链接，让读者能追溯到源头 # {Project Name}

🎯 一句话定位

{是什么、解决什么问题}

⚙️ 核心机制

{技术原理/架构，用人话讲清楚，不是复制 README。包含关键技术栈。}

📊 项目健康度

Stars: {数量} | Forks: {数量} | License: {类型}
团队/作者: {背景}
Commit 趋势: {最近活跃度 + 项目阶段判断}
最近动态: {最近几条重要 commit 概述}

🔥 精选 Issue

{Top 3-5 高质量 Issue，每条包含标题、链接、核心讨论点。如无高质量 Issue 则注明。}

✅ 适用场景

{什么时候该用，解决什么具体问题}

⚠️ 局限

{什么时候别碰，已知问题}

🆚 竞品对比

{同赛道项目对比，差异点。每个竞品必须附 GitHub 或官网链接，格式示例：}

vs GraphRAG — 差异描述
vs RAGFlow — 差异描述

🌐 知识图谱

DeepWiki: {链接或"未收录"}
Zread.AI: {链接或"未收录"}

🎬 Demo

{在线体验链接，或"无"}

📄 关联论文

{arXiv 链接，或"无"}

📰 社区声量

X/Twitter

{具体引用推文内容摘要 + 链接，格式示例：}

@某用户: "具体说了什么..."
某讨论串: 讨论了什么具体问题...

{如未找到则注明"未找到相关讨论"}

中文社区

{具体引用帖子标题/内容摘要 + 链接，格式示例：}

知乎: 帖子标题 — 讨论了什么
V2EX: 帖子标题 — 讨论了什么

{如未找到则注明"未找到相关讨论"}

💬 我的判断

{主观评价：值不值得投入时间，适合什么水平的人，建议怎么用}

Execution Notes 优先使用网页_搜索 + 网页_fetch，browser 作为备选搜索增强：项目调研类任务默认使用搜索-layer v2 Deep 模式 + --intent exploratory（Brave + Exa + Tavily 三源并行去重 + 意图感知评分），单源失败不阻塞主流程抓取降级（强

License

运行时依赖

安装命令

技能文档

相关技能推荐