Skip to content

Latest commit

 

History

History
226 lines (152 loc) · 6.81 KB

File metadata and controls

226 lines (152 loc) · 6.81 KB

QMD OpenClaw Kit

CI License: MIT 基于 QMD

一个可复用的集成套件,用来把 QMD 变成 OpenClaw 与智能体工作流中的低 token 本地检索层。

简体中文 | English

导航

效果总览

实测运行状态

QMD 运行状态

Token 节省估算

QMD token 节省估算

当前审计快照

指标 当前结果
OpenClaw gateway reachable
QMD MCP running
QMD health endpoint ok
GPU 模式 CUDA(offloading: yes
已索引文档 125
已生成向量 291
检索 smoke test passed
估算 token 节省(分析值,不是账单导出) 约 33%–71%

说明:health / MCP / GPU / docs / vectors 这些指标来自当前在线部署的实测状态;token 节省部分来自代表性本地文档规模估算,不是 provider 计费后台直接导出的账单数字。

为什么 QMD 有用

没有 QMD 有 QMD
直接重读多个候选 markdown 文件 先做本地检索
常把 README / setup 大文档一起塞进上下文 只精读高概率相关文档
先花 token 找答案在哪 先缩小范围,再扩上下文
上下文很容易越滚越大 上下文更聚焦、更可控

可进一步阅读:

这是什么

QMD OpenClaw Kit 是一个构建在上游 QMD 之上的轻量集成层。 它不会内置、分叉或重新打包 QMD 源码,而是提供:

  • 实用的安装流程
  • 面向 WSL / Linux 的更稳妥后端选择包装脚本
  • 可重复执行的 collection / context 初始化脚本
  • OpenClaw MCP 配置模板
  • 适配 OpenClaw 的检索 skill
  • 中英双语文档

目标很简单:让 OpenClaw 在读取大量 markdown 之前,先通过本地检索缩小范围,从而降低 token 消耗。

为什么要做这个

OpenClaw 这类环境很容易累积大量知识文件:

  • 工作区文档
  • memory 日志
  • 自定义 skills
  • 上游产品文档
  • 项目说明与运维笔记

如果没有检索层,智能体会不断重复读取大量 markdown。 QMD 本身已经很适合本地检索;这个项目做的是把周边运维胶水补齐。

特性

  • 尊重上游:通过 npm 安装 @tobilu/qmd
  • 面向 OpenClaw:提供 MCP 与 skill 接入模板
  • 后端感知:优先使用真正可用的 GPU 后端;不满足条件时自动切到稳定 CPU 模式,避免在 WSL 里反复撞坏掉的 Vulkan 自动探测
  • 可批量初始化:一条脚本注册高价值 markdown 目录并附加 context
  • 中英双语:便于公开复用
  • 可迁移:稍作修改即可搬到另一个 OpenClaw 部署里

仓库结构

.
├── docs/
├── openclaw-custom-skills/
├── scripts/
└── templates/

快速开始

1)安装 QMD

./scripts/install-qmd.sh

默认会把 @tobilu/qmd 安装到当前用户的 npm prefix。

2)初始化 collections 与 contexts

WORKSPACE_ROOT="$HOME/.openclaw/workspace" \
OPENCLAW_HOME="$HOME/.openclaw" \
./scripts/bootstrap-collections.sh

脚本会注册常见的 OpenClaw 知识源,例如:

  • 工作区根目录 markdown
  • workspace memory
  • 本地 docs
  • OpenClaw 内置 skills / docs
  • 自定义 skills
  • 可选的 projects 目录

这个 bootstrap 脚本被设计成可重复安全执行

  • 已存在的 collections 会复用
  • collection contexts 会原位刷新
  • 缺失目录会被干净跳过

3)把 QMD 接进 OpenClaw MCP

参考:templates/openclaw.jsonc

推荐方式:

  • 正常安装 QMD
  • 在 OpenClaw 的 MCP 配置里调用 scripts/start-qmd-mcp.sh
  • 让包装脚本自动选择更稳妥的后端模式

4)可选:生成 embeddings

QMD_LLAMA_GPU=false qmd embed --max-docs-per-batch 12 --max-batch-mb 8

在纯 CPU 或 GPU 环境不稳定时会更慢,但通常更可靠。

GPU / 后端策略

这个项目把后端选择当成运维问题,而不是宣传词。

优先级:

  1. 优先尊重显式设置的 QMD_LLAMA_GPU
  2. 检测到真正可用的 CUDA 用户态条件时使用 CUDA
  3. 检测到 Vulkan 工具链完整时使用 Vulkan
  4. 否则强制回落到 CPU,优先保证稳定性

这样可以避免很多 WSL / 无头环境里常见的问题:自动探测反复尝试一个实际上不可用的 Vulkan 构建路径。

OpenClaw skill

可复用 skill 位于:

它的原则很简单:

  1. 先用 QMD 检索
  2. 再精读真正相关的文件
  3. 把高 token 的大段重读放到最后

文档与示例

核心文档

示例

项目卫生

发布状态

这个仓库现在已经进入首个可复用发布阶段。

建议首个版本标签:

  • v0.1.0

致谢与归属

本项目基于上游 QMD,作者 / 贡献者为 tobi 等人:

请把本项目看作集成套件,而不是上游文档的替代品。

License

本集成套件采用 MIT 许可证。

上游 QMD 仍然遵循其自身项目的许可证,本仓库不会对其重新授权。