运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install industry-news-collector
镜像加速npx clawhub@latest install industry-news-collector --registry https://cn.longxiaskill.com 镜像可用
技能文档
行业新闻采集器 收集、聚合并按热度排序指定行业的新闻。
核心原则 不要只搜索"XX行业新闻"。泛搜索返回的是 SEO 聚合页和趋势预测文章,会系统性遗漏社区级病毒传播现象(如开源工具爆火、Meme 级事件)。必须用多维度、分层搜索策略。明确行业边界。每个行业都有其特定的范围和边界,必须严格定义目标行业的核心内容,排除相关但不相关的行业资讯。
行业边界定义 定义方法 核心术语法:通过列举目标行业的核心术语来定义行业范围 负面排除法:明确列出应排除的相关但不相关的行业术语 来源验证法:通过确认新闻来源的行业属性来验证内容相关性
示例:氢能行业边界 包含: 氢气的生产、储运和应用 氢燃料电池技术和产品 加氢站基础设施 氢能源政策和市场 绿氢、蓝氢、灰氢相关技术 排除: 风能、太阳能、光伏等其他可再生能源 传统化石能源(石油、天然气、煤炭) 核能 生物质能、地热能、潮汐能
边界判断标准 主要内容原则:新闻的主要内容必须是目标行业 核心术语原则:新闻必须包含目标行业的核心术语 来源相关原则:新闻来源必须与目标行业相关
工作流程
- 多维度分层搜索(最少 8 次,建议 10-12 次)
- "last week in XX行业" [当前月份年份]
- "XX行业 周报" [当前月份年份]
- "XX行业 产品发布" [当前月份]
- "XX行业 融资" [当前月份年份]
- "XX行业 商业" [当前月份年份]
- "XX行业 投资" [当前月份年份]
- "XX行业 研究突破" [当前月份]
- "XX行业 论文" [当前月份]
- "XX行业 技术突破" [当前月份]
- "XX行业 监管" [当前月份年份]
- "XX行业 政策" [当前月份年份]
- "XX行业 法律" [当前月份年份]
- "XX行业 治理" [当前月份年份]
- 交叉验证与补漏
- 搜索关键词设计原则(反模式清单)
- 行业特定搜索词库
- 热度综合判断
- 输出格式
- [新闻标题] > 一句话摘要(不超过 50 字) > 来源名称
- ...
本次共收集 XX 条新闻 | 搜索 XX 次 | 覆盖维度:A/B/C/D/E | 更新时间:HH:MM
- 去重与合并
- 内容筛选机制
筛选流程 初步筛选:基于搜索关键词和负面关键词进行过滤 深度筛选:分析新闻标题和正文,评估行业相关性 来源筛选:优先选择行业专业媒体和权威机构的内容 交叉验证:通过多个来源确认新闻的行业属性
推荐新闻源 详见 references/sources.md。
注意事项 优先使用 HTTPS 链接 遇到付费墙/无法访问的内容,标注"需订阅" 保持客观,不对新闻内容做主观评价 搜索不足 8 次不要开始输出 如果某个维度搜索结果为空,换关键词再搜一次