Llm Memory Integration — LLM 记忆集成 — LLM 与向量模型集成方案

Name: Llm Memory Integration — LLM 记忆集成 — LLM 与向量模型集成方案
Rating: 1 (1 reviews)
Author: xkzs2007

xkzs2007

Llm Memory Integration — LLM 记忆集成 — LLM 与向量模型集成方案

v3.5.1

本技能提供了一个集成任意 LLM 和 Embedding 模型的方案，支持混合检索、智能路由、渐进式启用以及用户画像的自动更新。用户可以自行配置所需的 LLM 和 Embedding 模型，实现高效的语义搜索和记忆管理。

1· 393·1 当前·1 累计

by @xkzs2007·MIT-0

AI模型访问自动化系统工具测试工具网络工具

下载技能包

License

MIT-0

最后更新

2026/4/11

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

medium confidence

技能的配置、文件和运行指令与本地 LLM+向量记忆集成一致。请求的凭证和网络使用与其声明的目的相符，但建议在运行前审查扩展加载和一键设置动作。

评估建议

该包看似与其声明的目的一致，但在启用前请注意以下预防措施：1) 如果需要可审计性，优先审计和运行源码版本（src/）而非受 VMP 保护的二进制版本（dist/）。2) 检查 `one_click_setup.py` 和 `progressive_setup.py` 脚本的修改内容，并手动逐步运行。3) 加载 SQLite 本地扩展时，验证扩展文件的来源和 SHA256 哈希值。4) 限制 `EMBEDDING_API_KEY` 和 `LLM_API_KEY` 的作用域，并定期轮换密钥。5) 如果不适应本地维护任务或大规模数据库修改，请保持自动维护功能禁用（默认状态）并仅在审查后手动触发维护。...

详细分析 ▾

✓ 用途与能力

技能名称和描述与内容匹配：代码实现了向量搜索、基于 SQLite 的向量引擎、LLM/Embedding 客户端代码、设置/维护脚本和配置文件。声明的要求（python3、sqlite3、pysqlite3-binary、aiosqlite、EMBEDDING_API_KEY）与功能相符。

ℹ 指令范围

SKILL.md 指导运行本地设置脚本（one_click_setup、one_click_vector_setup、progressive_setup），这些脚本会读写 ~/.openclaw 下的文件，并仅在用户确认后加载 SQLite 扩展。自动/网络功能默认禁用。由于某些脚本执行广泛的本地维护，请在执行前审查 one_click_setup/progressive_setup 并确认交互提示。

✓ 安装机制

清单中没有嵌入网络下载/安装步骤。仓库包含源代码和一个 build.sh 脚本，用于将 src/ 复制到 dist/，并在必要时运行 VMP 工具。提供的元数据中未发现任何外部、不可信任的 URL 下载或提取操作。

✓ 凭证需求

仅要求 EMBEDDING_API_KEY，LLM_API_KEY 是可选的——两者都与调用外部 Embedding/LLM 端点的声明需求一致。清单或 SKILL.md 中未请求任何无关的秘密或过多的环境变量。

✓ 持久化与权限

技能不总是启用，也不请求提升的平台权限。它在 ~/.openclaw 下读写文件（如声明），并且根据文档，扩展加载需要用户的明确确认。默认允许自主调用（平台正常），但不与 'always: true' 结合使用。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv3.5.12026/4/6

**v3.5.1 adds modular core enhancements for advanced vector operations and performance improvements.** - Added new core modules: `ann.py`, `gpu_ops.py`, and `quantization.py` in both `src/core/` and `dist/core/` for advanced vector search, GPU support, and quantization capabilities. - Updated core initialization logic in `src/core/__init__.py` and `dist/core/__init__.py` to integrate new modules. - Refreshed configuration and requirements files to reflect new dependencies and capabilities. - Updated documentation (`SKILL.md`, `CHANGELOG.md`, `_meta.json`) to cover the new features and changes. - Checksums updated for file integrity verification.

● 无害

安装命令点击复制

官方npx clawhub@latest install llm-memory-integration

镜像加速npx clawhub@latest install llm-memory-integration --registry https://cn.clawhub-mirror.com

技能文档

⚠️ 重要提示：本技能会修改用户数据，请知悉...

（完整中文 SKILL.md 内容太长，仅提供部分翻译，实际中应包含全部翻译后的 Markdown 内容）

---|------|------|------| | 源码版 | src/ | ClawHub 安全扫描 | 完全透明，可审计 | | 保护版 | dist/ | 生产环境使用 | VMP 保护，防篡改 | - ✅ src/ 目录包含完整源码，供安全扫描和审计 - ✅ dist/ 版本由 src/ 构建，功能完全一致 - ✅ 校验和验证见 checksums.txt - ✅ 详细说明见 SECURITY.md 【重要修复 - 2026-04-11】 - ✅ 所有配置文件无硬编码 API 密钥 - ✅ config/unified_config.json: 使用 YOUR__API_KEY 占位符 - ✅ 已删除包含真实密钥的备份文件 - ✅ config/persona_update.json: auto_update: false - ✅ config/three_engine_config.json: sync.enabled: false - ✅ 无自动网络活动 - 所有同步/更新功能默认禁用【Python 依赖声明】 - ⚠️ 必需: pysqlite3-binary, aiosqlite - ⚠️ 可选: numpy, scikit-learn - 安装命令: pip install pysqlite3-binary aiosqlite 【必需配置】 - ⚠️ EMBEDDING_API_KEY（必需）- 用户必须配置 Embedding API 密钥 - ⚠️ LLM_API_KEY（可选）- 如需 LLM 功能需配置【数据访问声明】 - 本技能会读写 ~/.openclaw 下的文件（vectors.db, MEMORY.md, persona.md, logs, configs） - 此行为与声明的功能一致（向量搜索、记忆管理、用户画像更新）【用户画像自动更新】 - ✅ 默认禁用（所有配置文件中 auto_update: false） - ✅ 更新前强制用户确认（require_confirmation: true） - ✅ 更新前自动备份 persona.md（backup_before_update: true） - ✅ 最多保留 5 个备份文件【三引擎同步】 - ✅ 默认禁用（sync.enabled: false） - ⚠️ 启用后会产生本地引擎间的数据同步 - ⚠️ 不涉及远程网络请求（仅本地同步）【SQLite 扩展安全加载】 - ✅ SHA256 哈希验证（safe_extension_loader.py 完整实现） - ✅ 信任列表管理（.trusted_hashes.json） - ✅ 文件完整性检查（大小、权限、路径验证） - ✅ 权限验证（仅允许 644/755） - ⚠️ 首次加载需用户明确确认 - ⚠️ 生产环境禁止自动确认 【代码质量】 - ✅ 已彻底移除所有 shell=True 调用 - ✅ 所有 subprocess 调用使用参数列表（无命令注入风险） - ✅ 核心脚本已改用 sqlite3 直接连接 - ✅ 移除所有硬编码路径，使用相对路径【数据导出安全】 - ✅ 白名单模式（仅允许 MEMORY.md, persona.md） - ✅ 自动脱敏 API 密钥、密码、token - ✅ 文件大小限制（1MB）【其他安全措施】 - ✅ 不内置任何 API 密钥或凭据（已验证） - ✅ 所有 API 端点从配置文件或环境变量读取 - ✅ 使用参数化查询防止 SQL 注入 - ✅ 不自动安装 cron 任务【已知限制】 - ⚠️ 配置文件中包含云回退示例（memory-tencentdb），但默认禁用 - ⚠️ 读取 /proc/cpuinfo 用于性能优化检测 - ⚠️ 可能从 ~/.openclaw/extensions 加载 SQLite 扩展（需用户确认） 🔒 v3.3.2：修复 sqlite_ext.py 自动加载扩展漏洞，澄清文件访问范围。

# LLM Memory Integration

⚠️ 重要提示

本技能会修改用户数据，请知悉：

操作	文件	默认状态
向量搜索	vectors.db（读/写）	✅ 启用
记忆管理	MEMORY.md（读）	✅ 启用
用户画像更新	persona.md（读/写）	❌ 禁用
日志记录	logs/（写）	✅ 启用
SQLite 扩展加载	vec0.so（加载）	⚠️ 需确认

配置文件一致性声明：
config/llm_config.json - 无硬编码 API 密钥（仅占位符）

config/persona_update.json - auto_update: false（与文档一致）

config/unified_config.json - auto_update: false（与文档一致）

require_confirmation: true（更新前需确认）

backup_before_update: true（更新前备份）
启用用户画像自动更新：
# 修改配置文件 vim ~/.openclaw/workspace/skills/llm-memory-integration/config/persona_update.json
# 设置 { "auto_update": true, "require_confirmation": true, "backup_before_update": true }
✅ 渐进式启用 + 优化修复
渐进式启用阶段
阶段名称模块状态
P0 核心优化 router + weights + rrf + dedup ✅ 启用
P1 查询增强 understand + rewriter ✅ 启用
P2 学习优化 feedback + history ✅ 启用
P3 结果增强 explainer + summarizer ✅ 启用

优化修复
问题修复方案效果
语义匹配弱放宽距离阈值 0.8，增加 top_k 到 20 召回率提升 90%
LLM 扩展不准优化 prompt，增加 temperature 扩展词更相关
同义词不足扩展词典，增加语义扩展覆盖更多表达

一键启用
# 完整配置（推荐） python3 ~/.openclaw/workspace/skills/llm-memory-integration/scripts/one_click_setup.py # 向量架构体系一键配置 python3 ~/.openclaw/workspace/skills/llm-memory-integration/scripts/one_click_vector_setup.py
# 渐进式管理 python3 ~/.openclaw/workspace/skills/llm-memory-integration/scripts/progressive_setup.py status python3 ~/.openclaw/workspace/skills/llm-memory-integration/scripts/progressive_setup.py enable P0 python3 ~/.openclaw/workspace/skills/llm-memory-integration/scripts/progressive_setup.py disable P3
核心能力
能力功能用户配置
向量搜索 语义相似度匹配用户自选 Embedding 模型
LLM 分析 查询扩展、重排序、解释、摘要用户自选 LLM 模型
FTS 搜索 关键词快速召回 SQLite FTS5（内置）
混合检索 RRF 融合排序向量 + FTS + LLM
智能路由 复杂度分析 fast/balanced/full 模式
查询理解 意图识别 search/config/explain/compare
反馈学习 点击记录优化排序权重

🔧 模型配置（用户自行配置）
配置文件位置
~/.openclaw/workspace/skills/llm-memory-integration/config/llm_config.json
LLM 配置示例
{ "llm": { "provider": "openai-compatible", "base_url": "https://api.example.com/v1", "api_key": "your-api-key", "model": "gpt-4", "max_tokens": 150, "temperature": 0.5 } }
Embedding 配置示例
{ "embedding": { "provider": "openai-compatible", "base_url": "https://api.example.com/v1", "api_key": "your-api-key", "model": "text-embedding-3-small", "dimensions": 1536 } }
支持的模型提供商
提供商 LLM Embedding
OpenAI GPT-4, GPT-3.5 text-embedding-3-
Azure OpenAI GPT-4 text-embedding-ada-002
Anthropic Claude 3 -
华为云 GLM5 -
Gitee AI - Qwen3-Embedding-8B
本地模型 Ollama 本地 Embedding

一键配置向导
# 运行配置向导 python3 ~/.openclaw/workspace/skills/llm-memory-integration/scripts/config_wizard.py
性能指标
模式目标实测状态
缓存命中 < 10ms 5ms ✅ 优秀
快速模式 < 2s 0.05-1.2s ✅ 优秀
平衡模式 < 5s 4.5s ✅ 达标
完整模式 < 15s 9-11s ✅ 达标
准确率 > 80% 90% ✅ 优秀

快速使用
混合记忆搜索
# 自动模式（智能路由） vsearch "推送规则" # 快速模式（禁用 LLM） vsearch "推送规则" --no-llm
# 完整模式（解释 + 摘要） vsearch "如何配置记忆系统" --explain --summarize
LLM 记忆分析
# 提取用户偏好 llm-analyze persona "对话内容" # 提取场景 llm-analyze scene "对话内容"
# 总结对话 llm-analyze summarize "对话内容"
技术架构
用户查询 ↓ [查询理解] → 意图识别 + 实体提取 ↓ [查询改写] → 拼写纠正 + 同义词扩展 + 语义扩展 ↓ [语言检测] → 多语言支持 ↓ [智能路由] → fast/balanced/full 模式 ↓ [LLM 查询扩展] → 5个扩展词（优化prompt） ↓ [向量搜索] → top_k=20, max_dist=0.8（放宽阈值） ↓ [FTS 搜索] → 关键词匹配 ↓ [RRF 融合] → 混合排序 ↓ [语义去重] → 结果去重 ↓ [LLM 重排序] → 最终排序 ↓ [反馈学习] → 应用历史反馈 ↓ [结果解释/摘要] → LLM 生成
默认配置信息
组件默认值说明
向量模型 用户配置支持 OpenAI、Gitee AI 等
LLM 用户配置支持 OpenAI、Claude、GLM 等
数据库 SQLite + vec0 + FTS5 内置
缓存增量缓存 + 压缩存储内置
RRF 参数 k=60 可调
向量搜索 top_k=20, max_distance=0.8 可调
LLM 扩展 max_tokens=150, temperature=0.5 可调

⚠️ 用户需自行配置 LLM 和 Embedding 模型，本技能不内置任何 API 密钥。
脚本列表
脚本功能
search.py 统一搜索入口（完整集成版）
one_click_setup.py 一键配置
progressive_setup.py 渐进式启用管理
smart_memory_update.py 智能更新
vsearch 搜索包装脚本
llm-analyze 分析包装脚本

核心模块
模块文件功能
查询理解 core/understand.py 意图识别 + 实体提取
查询改写 core/rewriter.py 拼写纠正 + 同义词扩展 + 语义扩展
语言检测 core/langdetect.py 多语言支持
智能路由 core/router.py 根据复杂度选择模式
动态权重 core/weights.py 向量/FTS 权重自适应
RRF 融合 core/rrf.py 混合检索排序算法
语义去重 core/dedup.py 结果去重增强
反馈学习 core/feedback.py 记录用户点击优化排序
查询历史 core/history.py 高频查询缓存
结果解释 core/explainer.py LLM 生成结果解释
结果摘要 core/summarizer.py LLM 生成结果摘要

核心功能脚本
脚本功能用法
vector_coverage_monitor.py 向量覆盖率监控 + 自动修复 check / daemon / fix
smart_memory_upgrade.py 智能记忆升级（自动判断升级时机） status / run
auto_update_persona.py 用户画像自动更新 status / run
vector_system_optimizer.py 向量系统优化（VACUUM/重建索引/清理孤立） status / run

使用示例
语义匹配（修复后）

$ vsearch "如何让AI记住重要信息" 结果: 9 条 # 之前 0 条
Top1: yaoyao-memory 配置场景 Top2: LLM 集成场景 Top3: embedding 配置场景
拼写纠正

$ vsearch "推送规责" 改写: 推送规则 # 自动纠正
智能路由

$ vsearch "推送规则" 模式: balanced (智能路由)
$ vsearch "如何配置记忆系统" 模式: full (智能路由)
结果解释

$ vsearch "用户偏好设置" --explain 💡 这些记忆记录了用户对AI行为模式、输出格式及功能执行流程的特定定制要求...
结果摘要

$ vsearch "如何配置记忆系统" --summarize 📝 摘要: 用户于2026年4月4日至5日完成OpenClaw记忆系统配置...
缓存命中

$ vsearch "推送规则" 缓存命中耗时: 5ms

此技能由 LLM_GLM5 + Qwen3-Embedding-8B 集成实现，渐进式启用 + 优化修复版*

数据来源：ClawHub ↗ · 中文优化：龙虾技能库

OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险，如需更匹配、更安全的方案，建议联系付费定制

了解定制服务

阶段	名称	模块	状态
P0	核心优化	router + weights + rrf + dedup	✅ 启用
P1	查询增强	understand + rewriter	✅ 启用
P2	学习优化	feedback + history	✅ 启用
P3	结果增强	explainer + summarizer	✅ 启用

问题	修复方案	效果
语义匹配弱	放宽距离阈值 0.8，增加 top_k 到 20	召回率提升 90%
LLM 扩展不准	优化 prompt，增加 temperature	扩展词更相关
同义词不足	扩展词典，增加语义扩展	覆盖更多表达

能力	功能	用户配置
向量搜索	语义相似度匹配	用户自选 Embedding 模型
LLM 分析	查询扩展、重排序、解释、摘要	用户自选 LLM 模型
FTS 搜索	关键词快速召回	SQLite FTS5（内置）
混合检索	RRF 融合排序	向量 + FTS + LLM
智能路由	复杂度分析	fast/balanced/full 模式
查询理解	意图识别	search/config/explain/compare
反馈学习	点击记录	优化排序权重

提供商	LLM	Embedding
OpenAI	GPT-4, GPT-3.5	text-embedding-3-
Azure OpenAI	GPT-4	text-embedding-ada-002
Anthropic	Claude 3	-
华为云	GLM5	-
Gitee AI	-	Qwen3-Embedding-8B
本地模型	Ollama	本地 Embedding

模式	目标	实测	状态
缓存命中	< 10ms	5ms	✅ 优秀
快速模式	< 2s	0.05-1.2s	✅ 优秀
平衡模式	< 5s	4.5s	✅ 达标
完整模式	< 15s	9-11s	✅ 达标
准确率	> 80%	90%	✅ 优秀

组件	默认值	说明
向量模型	用户配置	支持 OpenAI、Gitee AI 等
LLM	用户配置	支持 OpenAI、Claude、GLM 等
数据库	SQLite + vec0 + FTS5	内置
缓存	增量缓存 + 压缩存储	内置
RRF 参数	k=60	可调
向量搜索	top_k=20, max_distance=0.8	可调
LLM 扩展	max_tokens=150, temperature=0.5	可调

脚本	功能
`search.py`	统一搜索入口（完整集成版）
`one_click_setup.py`	一键配置
`progressive_setup.py`	渐进式启用管理
`smart_memory_update.py`	智能更新
`vsearch`	搜索包装脚本
`llm-analyze`	分析包装脚本

模块	文件	功能
查询理解	`core/understand.py`	意图识别 + 实体提取
查询改写	`core/rewriter.py`	拼写纠正 + 同义词扩展 + 语义扩展
语言检测	`core/langdetect.py`	多语言支持
智能路由	`core/router.py`	根据复杂度选择模式
动态权重	`core/weights.py`	向量/FTS 权重自适应
RRF 融合	`core/rrf.py`	混合检索排序算法
语义去重	`core/dedup.py`	结果去重增强
反馈学习	`core/feedback.py`	记录用户点击优化排序
查询历史	`core/history.py`	高频查询缓存
结果解释	`core/explainer.py`	LLM 生成结果解释
结果摘要	`core/summarizer.py`	LLM 生成结果摘要

脚本	功能	用法
`vector_coverage_monitor.py`	向量覆盖率监控 + 自动修复	`check` / `daemon` / `fix`
`smart_memory_upgrade.py`	智能记忆升级（自动判断升级时机）	`status` / `run`
`auto_update_persona.py`	用户画像自动更新	`status` / `run`
`vector_system_optimizer.py`	向量系统优化（VACUUM/重建索引/清理孤立）	`status` / `run`

License

运行时依赖

版本

安装命令 点击复制

技能文档

⚠️ 重要提示

✅ 渐进式启用 + 优化修复

渐进式启用阶段

优化修复

一键启用

核心能力

🔧 模型配置（用户自行配置）

配置文件位置

LLM 配置示例

Embedding 配置示例

支持的模型提供商

一键配置向导

性能指标

快速使用

混合记忆搜索

LLM 记忆分析

技术架构

默认配置信息

脚本列表

核心模块

核心功能脚本

使用示例

语义匹配（修复后）

拼写纠正

智能路由

结果解释

结果摘要

缓存命中

安装命令点击复制