Skip to content
银河录像局
MITCE 机场

今天,我将结合前 OpenAI 联合创始人、AI 大神卡帕西(Karpathy)提出的 LMwiki 理念 ,手把手教你如何使用 Claude Code(或 Code X)配合 Obsidian,在你的电脑上打造一个纯离线、全本地、具备复利生长能力的个人 AI 知识库。

为了让你在获取大模型和学习资料时畅通无阻,文章最后我还为你准备了老司机私藏的全网资源下载神器。干货满满,建议先收藏再阅读!

一、 为什么要放弃传统 RAG,转向 LMwiki?

卡帕西最近提出的个人 AI 知识库理念 LMwiki,彻底摒弃了传统的 RAG(检索增强生成)系统 。

  • 传统 RAG 的痛点: 每次问答都是重新搜索知识库,AI 没有任何记忆和积累 。聊完就忘,下次还需要重复检索 。

  • LMwiki 的优势: 它是一套极简的系统,通过 AI 智能体将学习资料编译成 Wiki 形式的 Markdown 笔记库 。通过持续的提问与探索,每次学习的重要内容都会再次积累到知识库中,实现“知识的复利” 。它维护的是一个持久化的知识库,就像一个生命体一样自动生长,越来越聪明 。

二、 核心理念:三层架构与三大核心操作

要搭建这套系统,我们需要理解它的骨架。整个架构实际上就是“智能体工具 + Obsidian” 。

1. 三层架构

  • 原始资料层 (Raw): 这是我们的收集箱(Inbox),存放收集或剪藏的网页文章、论文文献、YouTube 视频转录稿等 。

  • Wiki 实体层 (wiki): AI 智能体对原始资料进行深度分析后生成的 Markdown 文件目录 。包含索引文件 (index.md)、日志文件 (log.md)、方法论 (concepts)、实体概念 (entities)、原文摘要 (sources) 以及深度学习的知识积累 (Synthesis) 。此外还会有一个 assets 文件夹存放图片和附件等媒体资源 。

  • 架构规范层 (Schema): 智能体工具的配置文件。如果你使用 Claude Code,那就是 claude.md 文件;如果使用 Open Code / Code X,那就是 agents.md 。它规定了目录结构权限、生成内容的规范以及索引格式 。

2. 三大核心操作 (Skills)

系统通过配置三个主要的 Skill 来运行:

  • injest(摄取): 触发后,AI 会充分消化 Raw 文件夹下的原始资料,提取核心摘要和实体页面,并编译成 Markdown 格式的 Wiki 笔记库,建立双向链接,更新索引和日志,最后将原始文件归档 。

  • query(查询): 用户向 AI 提问进行深度学习 。AI 必须先读取 index.md 定位相关内容,解答后若生成了有价值的内容,会询问用户是否保存回知识库的 Synthesis 文件夹,实现知识复利 。

  • lint(巡检): 定期对知识库进行健康检查 。扫描双向链接关联、死链、孤立页面、知识冲突以及老旧信息 。生成体检报告和修复计划,等待用户确认后再修改,防止 AI 擅自篡改 。

三、 纯离线本地化部署:软件准备与大模型配置

如果你处理的是私密个人或公司资料,纯离线环境是必须的 。你需要以下几款核心软件:Claude CodeObsidianLM Studio 以及 Obsidian Web Clipper

1. 部署本地大模型 (LM Studio)

LM Studio 可以下载各种开源模型(如 Qwen, DeepSeek)并运行在本地供智能体调用 。

  • 硬件要求与模型选择: 想要模型流畅运行,必须满足公式:模型文件体积 + KV 缓存占用 + 运行内存空间 < 可用显存

  • 实例: 一个 30B 规模的 Q4 量化模型体积约 18-20GB,若要处理 128K 上下文,其 KV 缓存和运行显存会额外占用 10GB 以上,总计至少需要 30GB 以上的可用显存 。

  • 开启 API: 模型下载后,在开发者选项中打开 Server 开关,将本地模型暴露为 API 接口 。

2. 连接智能体与本地大模型

对于 Claude Code,你需要修改配置文件来连通 LM Studio:

  1. 找到系统目录下的 .claude 文件夹,打开 settings.js

  2. 将接口地址修改为 LM Studio 的地址 。

  3. 验证 Token 随便填几个字母占位即可 。

  4. 将三个模型字段全部改为你下载的本地模型 ID,保存后在终端输入 claude 即可启动 。

3. 打造一体化工作台 (Obsidian + Claudin)

  1. 下载并安装无缝管理本地 Markdown 文件的 Obsidian 。

  2. 在插件市场安装 BRAT 插件(用于安装第三方测试版插件) 。

  3. 通过 BRAT 输入 Claudin 开源地址进行安装并启用 。

  4. 它的作用是将智能体直接嵌入到 Obsidian 的侧边栏,你的笔记库就变成了智能体的工作目录,完美复现左边知识库、右边 AI 助手的协同状态 。

四、 从 0 到 1 实战演示

  1. 初始化: 创建空仓库,将卡帕西的 LMwiki 原文放入,在侧边栏命令 AI 深度阅读并初始化知识库。它会自动建好 Rawwiki 文件夹以及 index.mdlog.md 和类似于员工操作手册的 claude.md(或 agents.md)规范文件 。

  2. 收集资料: 使用浏览器插件 Obsidian Web Clipper,一键将想看的网页文章以干净的纯文本 Markdown 格式保存到 Raw 文件夹中 。

  3. 指令触发: 在对话框中告诉 AI 整理资料或直接输入 /injest 。AI 会自动接管繁琐的节点编织和打标签工作 。

  4. 探究与生长: 通过 /query 提问,比如“结合 5C 提示框架为我设计提示词” 。AI 查阅资料后给出回答,并将优质内容重新沉淀到知识库中 。

避坑指南:

  • Token 消耗巨大: 大规模的文件读写非常消耗 Token,务必注意使用量 。建议在 Skill 中加入约束,集成 ops cli 命令行工具来辅助 AI 检索,可大幅降低消耗并提升准确性 。
  • 警惕 AI 幻觉: 如果大模型在处理中产生幻觉,错误会被固化在知识库中,并在未来的学习推理中被无限放大 。

五、 专属福利:构建离线资料素材库的下载神器

在搭建纯离线知识库时,我们不可避免地需要下载动辄几十上百 GB 的开源大模型文件、学术论文种子包或视频教程。这里为你盘点 4 款全网免费、不限速的磁力/BT 下载神器,告别吸血雷 。

  • qBittorrent 增强版 (qBEE): 老司机必备,相当于种子界的 IDM 。自动封禁某雷、某度等“只下载不上传”的吸血客户端 。内置全网最强 Tracker 服务器列表自动订阅(即使是老种子也能救活),并且自带 Python 搜索引擎插件,想搜什么直接在软件内搞定 。

官网:https://github.com/c0re100/qBittorrent-Enhanced-Edition/releases

  • Gopeed: 非常年轻的开源新星,极简苹果风界面 。全平台制霸(Win/Mac/Linux/iOS/Android/Docker),内存占用极低 。支持 HTTP、BT、ED2K,下载速度媲美 IDM,且能通过浏览器扩展接管下载任务 。

官网:https://gopeed.com/

  • Transmission: Mac 用户和 NAS 玩家的白月光 。极其干净,没有任何花里胡哨的功能或弹窗,运行时 CPU 和内存占用几乎可以忽略不计,非常适合极客长期挂在后台跑下载 。缺点是没有防吸血和自动 Tracker 订阅功能 。

官网:https://transmissionbt.com/

  • imFile: 基于曾经的神器 Motrix 的原生代码重构的进阶开源版 。支持全协议下载,最大卖点是内置 DoH 功能,能绕过运营商的 DNS 劫持和污染,让 BT 速度快速回血 。自带资源搜索、选择性下载和自动更新 Tracker,缺点是安装包和内存占用比 qBEE 略大 。

官网:https://imfile.org/

Github官网:https://github.com/imfile-io/imfile-desktop