AI大佬如何搭建个人AI知识库？从0开始用Claude Code + Obsidian搭建Karpathy的LLM Wiki知识库

今天，我将结合前 OpenAI 联合创始人、AI 大神卡帕西（Karpathy）提出的 LMwiki 理念，手把手教你如何使用 Claude Code（或 Code X）配合 Obsidian，在你的电脑上打造一个纯离线、全本地、具备复利生长能力的个人 AI 知识库。

为了让你在获取大模型和学习资料时畅通无阻，文章最后我还为你准备了老司机私藏的全网资源下载神器。干货满满，建议先收藏再阅读！

一、为什么要放弃传统 RAG，转向 LMwiki？

卡帕西最近提出的个人 AI 知识库理念 LMwiki，彻底摒弃了传统的 RAG（检索增强生成）系统。

传统 RAG 的痛点： 每次问答都是重新搜索知识库，AI 没有任何记忆和积累。聊完就忘，下次还需要重复检索。
LMwiki 的优势： 它是一套极简的系统，通过 AI 智能体将学习资料编译成 Wiki 形式的 Markdown 笔记库。通过持续的提问与探索，每次学习的重要内容都会再次积累到知识库中，实现“知识的复利” 。它维护的是一个持久化的知识库，就像一个生命体一样自动生长，越来越聪明。

二、核心理念：三层架构与三大核心操作

要搭建这套系统，我们需要理解它的骨架。整个架构实际上就是“智能体工具 + Obsidian” 。

1. 三层架构

原始资料层 (Raw)： 这是我们的收集箱（Inbox），存放收集或剪藏的网页文章、论文文献、YouTube 视频转录稿等。
Wiki 实体层 (wiki)： AI 智能体对原始资料进行深度分析后生成的 Markdown 文件目录。包含索引文件 (index.md)、日志文件 (log.md)、方法论 (concepts)、实体概念 (entities)、原文摘要 (sources) 以及深度学习的知识积累 (Synthesis) 。此外还会有一个 assets 文件夹存放图片和附件等媒体资源。
架构规范层 (Schema)： 智能体工具的配置文件。如果你使用 Claude Code，那就是 claude.md 文件；如果使用 Open Code / Code X，那就是 agents.md 。它规定了目录结构权限、生成内容的规范以及索引格式。

2. 三大核心操作 (Skills)

系统通过配置三个主要的 Skill 来运行：

injest（摄取）： 触发后，AI 会充分消化 Raw 文件夹下的原始资料，提取核心摘要和实体页面，并编译成 Markdown 格式的 Wiki 笔记库，建立双向链接，更新索引和日志，最后将原始文件归档。
query（查询）： 用户向 AI 提问进行深度学习。AI 必须先读取 index.md 定位相关内容，解答后若生成了有价值的内容，会询问用户是否保存回知识库的 Synthesis 文件夹，实现知识复利。
lint（巡检）： 定期对知识库进行健康检查。扫描双向链接关联、死链、孤立页面、知识冲突以及老旧信息。生成体检报告和修复计划，等待用户确认后再修改，防止 AI 擅自篡改。

三、纯离线本地化部署：软件准备与大模型配置

如果你处理的是私密个人或公司资料，纯离线环境是必须的。你需要以下几款核心软件：Claude Code、Obsidian、LM Studio 以及 Obsidian Web Clipper 。

1. 部署本地大模型 (LM Studio)

LM Studio 可以下载各种开源模型（如 Qwen, DeepSeek）并运行在本地供智能体调用。

硬件要求与模型选择： 想要模型流畅运行，必须满足公式：模型文件体积 + KV 缓存占用 + 运行内存空间 < 可用显存 。
实例： 一个 30B 规模的 Q4 量化模型体积约 18-20GB，若要处理 128K 上下文，其 KV 缓存和运行显存会额外占用 10GB 以上，总计至少需要 30GB 以上的可用显存。
开启 API： 模型下载后，在开发者选项中打开 Server 开关，将本地模型暴露为 API 接口。

2. 连接智能体与本地大模型

对于 Claude Code，你需要修改配置文件来连通 LM Studio：

找到系统目录下的 .claude 文件夹，打开 settings.js 。
将接口地址修改为 LM Studio 的地址。
验证 Token 随便填几个字母占位即可。
将三个模型字段全部改为你下载的本地模型 ID，保存后在终端输入 claude 即可启动。

3. 打造一体化工作台 (Obsidian + Claudin)

下载并安装无缝管理本地 Markdown 文件的 Obsidian 。
在插件市场安装 BRAT 插件（用于安装第三方测试版插件）。
通过 BRAT 输入 Claudin 开源地址进行安装并启用。
它的作用是将智能体直接嵌入到 Obsidian 的侧边栏，你的笔记库就变成了智能体的工作目录，完美复现左边知识库、右边 AI 助手的协同状态。

四、从 0 到 1 实战演示

初始化： 创建空仓库，将卡帕西的 LMwiki 原文放入，在侧边栏命令 AI 深度阅读并初始化知识库。它会自动建好 Raw、wiki 文件夹以及 index.md、log.md 和类似于员工操作手册的 claude.md（或 agents.md）规范文件。
收集资料： 使用浏览器插件 Obsidian Web Clipper，一键将想看的网页文章以干净的纯文本 Markdown 格式保存到 Raw 文件夹中。
指令触发： 在对话框中告诉 AI 整理资料或直接输入 /injest 。AI 会自动接管繁琐的节点编织和打标签工作。
探究与生长： 通过 /query 提问，比如“结合 5C 提示框架为我设计提示词” 。AI 查阅资料后给出回答，并将优质内容重新沉淀到知识库中。

避坑指南：
Token 消耗巨大： 大规模的文件读写非常消耗 Token，务必注意使用量。建议在 Skill 中加入约束，集成 ops cli 命令行工具来辅助 AI 检索，可大幅降低消耗并提升准确性。
警惕 AI 幻觉： 如果大模型在处理中产生幻觉，错误会被固化在知识库中，并在未来的学习推理中被无限放大。

五、专属福利：构建离线资料素材库的下载神器

在搭建纯离线知识库时，我们不可避免地需要下载动辄几十上百 GB 的开源大模型文件、学术论文种子包或视频教程。这里为你盘点 4 款全网免费、不限速的磁力/BT 下载神器，告别吸血雷。

qBittorrent 增强版 (qBEE)： 老司机必备，相当于种子界的 IDM 。自动封禁某雷、某度等“只下载不上传”的吸血客户端。内置全网最强 Tracker 服务器列表自动订阅（即使是老种子也能救活），并且自带 Python 搜索引擎插件，想搜什么直接在软件内搞定。

官网：https://github.com/c0re100/qBittorrent-Enhanced-Edition/releases

Gopeed： 非常年轻的开源新星，极简苹果风界面。全平台制霸（Win/Mac/Linux/iOS/Android/Docker），内存占用极低。支持 HTTP、BT、ED2K，下载速度媲美 IDM，且能通过浏览器扩展接管下载任务。

官网：https://gopeed.com/

Transmission： Mac 用户和 NAS 玩家的白月光。极其干净，没有任何花里胡哨的功能或弹窗，运行时 CPU 和内存占用几乎可以忽略不计，非常适合极客长期挂在后台跑下载。缺点是没有防吸血和自动 Tracker 订阅功能。

官网：https://transmissionbt.com/

imFile： 基于曾经的神器 Motrix 的原生代码重构的进阶开源版。支持全协议下载，最大卖点是内置 DoH 功能，能绕过运营商的 DNS 劫持和污染，让 BT 速度快速回血。自带资源搜索、选择性下载和自动更新 Tracker，缺点是安装包和内存占用比 qBEE 略大。

官网：https://imfile.org/

Github官网：https://github.com/imfile-io/imfile-desktop

一、 为什么要放弃传统 RAG，转向 LMwiki？ ​

二、 核心理念：三层架构与三大核心操作 ​

1. 三层架构 ​

2. 三大核心操作 (Skills) ​

三、 纯离线本地化部署：软件准备与大模型配置 ​

1. 部署本地大模型 (LM Studio) ​

2. 连接智能体与本地大模型 ​

3. 打造一体化工作台 (Obsidian + Claudin) ​

四、 从 0 到 1 实战演示 ​

五、 专属福利：构建离线资料素材库的下载神器 ​