运行时依赖
安装命令
点击复制技能文档
知识 知识库检索 Skill 版本:v3.0(三层架构重构) | 2026-05-08 理念:零预处理、懒加载、渐进式检索 工作流:Phase 0(环境就绪)→ Phase A(定位文件)→ Phase B(阅读回答)
一、调用时机 应主动调用: 用户提到知识库中的具体文件、文档、报告名称 用户问制度、政策、标准、规范类问题 用户问数据来源、出处、依据 用户用自然语言描述信息需求,需从文件集合中定位 勿调用: 闲聊、开放性问题 用户明确要求用预训练知识回答 一般性编程 / Chat 类问题 多轮注意: 每一轮都重新判断「这个问题属于检索范畴吗?」,不得在多轮后习惯性切回预训练知识。
显式维护指令: 当用户明确说出「修复知识库」「重建索引」「更新知识库」「重新初始化」等指令时: → 重建 BM25 索引:执行 python .agents/skills/knowledge-retrieval/scripts/build_kb_index.py --project <项目名> → 完整重跑 Stage 0:按 references/knowledge-base-conventions.md 的 Stage 0 完整流程执行(重新扫描、生成 data_structure.md、重建索引、创建快捷方式) → 执行完成后告知用户操作结果
二、反幻觉铁律(强制执行) 优先级高于所有其他操作指令。 搜不到就是搜不到。 Phase A 零候选时,如实告知用户,不得用预训练知识填充或编造。 搜不全就说不全。 读了部分文件但不足以回答全部问题时,如实说明「已覆盖 X 方面,Y 方面未覆盖」,不做推测回答。 预训练知识不能替代检索结果。 即使预训练知识与文件原文一致,也以文件原文为准。有差异时如实报告差异,不做修正。 诚实第一,有用第二。 一个诚实的「没找到」比一个漂亮的「我猜的」更有价值。违背此项导致幻觉视为严重违规。 读取失败如实说。 文件损坏、读取超时、内容为空时,如实告知用户「该文件无法正常读取」,不得猜测其内容或编造。
三、流程总览(快速导航) 本 Skill 有两个入口,取决于用户意图: 入口 A:用户说「帮我建个知识库」或进入一个新项目 │ Stage 0 — 知识库初始化(一次性) ├ 创建 workspace 目录 ├ 扫描原始文件夹 → 生成 data_structure.md ├ 构建 BM25 索引 └ 创建双向快捷方式 └→ 完成后可进入搜索流程 入口 B:用户问了一个问题 │ Phase 0 — 搜索环境就绪检查 ├─ 原始文件夹还在吗? ├─ 文件索引和磁盘一致吗? └─ BM25 索引需要刷新吗? │ Phase A — 定位目标文件(双通道) ├─ 通道①:AI 语义匹配(读描述列) ├─ 通道②:BM25 算法搜索 └─ 合并去重 → Top 10 候选 │ Phase B — 阅读 + 回答 + 描述进化 ├─ 读候选文件 → 定位相关段落 ├─ 综合理解 → 回答 └─ 读完顺手更新文件描述 Stage 0 详情 → references/knowledge-base-conventions.md Phase 0/A/B 详情 → references/phase-execution.md
四、关键决策点(执行时在此自检) BM25 环境已由 Phase 0 自动检测并安装,无需在此分支判断。 决策 1:是否有 > 5 万字的候选文件? → 无 → Phase B 正常模式(顺序读取候选文件) → 有 → Phase B 切换大文件保护模式(关键词搜索→命中段落阅读) [自检] 候选文件的累计大小是否接近上下文容量的 70%?是则提前切换策略。 决策 2:Phase A 零候选? → 执行反幻觉铁律第 1 条:如实告知用户「没有匹配的内容」 → 不得用预训练知识填充 [自检] 我确认了零候选,还是我跳过了验证步骤就回答了? 决策 3:原始文件夹有新增/删除文件? → Phase 0 检查时发现差异 → 自动更新 data_structure.md → 标记 BM25 为 stale → 下次走 Phase A 时自动重建索引 [自检] 我确认了索引新鲜度,还是直接用旧索引搜索了? 决策 4:Phase B 读完文件后,描述列更新了吗? → 已更新 → 下一题 → 未更新 → 立即执行描述进化(详见 references/phase-execution.md → 描述进化) [自检] 我确认了刚读的文件的描述已更新,还是以为「下次会记得」就跳过了?
五、降级规则摘要 条件 行为 详情 候选大文件 Phase B 切关键词搜索模式 references/phase-execution.md 扫描件 PDF OCR 处理 + 缓存 references/file-handling.md → 2.2 无图像分析能力 跳过图片分析,标注能力限制 references/degradation.md
六、文件索引相关 知识库目录规范 → references/knowledge-base-conventions.md 环境安装 → references/environment-setup.md 数据流及工具生态 → 各 references/ 文件对应章节 快速参考:本节仅含流程骨架和决策自检点。所有详细操作步骤见 references/ 目录下对应文件。