source-summary
Karpathy LLM Wiki Architecture
Karpathy LLM Wiki Architecture
Recordings-35-.txt Recordings Andrej Karpathy 最近分享了一個關於 LLM 知識庫的全新思路,引發了極大迴響。傳統做法(RAG)的問題在於:每次提問,AI 都從零開始檢索文件片段,然後重新組織答案。知識沒有積累,每次都在重複勞動。 Karpathy 提出的替代方案是:讓 LLM 主動建立一個持續維護的 Wiki。這個 Wiki 是一組結構化的 Markdown 文件,由 LLM 全權負責維護。每當有新資料進來,LLM 不是單純索引,而是真的去閱讀、提取關鍵資訊、整合進現有知識體系。更新實體頁面、修訂主題摘要、標記新舊資料的矛盾、補充交叉引用。知識被「編譯」一次,然後持續維護,而不是每次查詢都重新推導。 架構分為三層: 第一層 Raw Sources(原始資料):所有原始材料——論文、文章、圖片、數據文件。這層是不可變的,LLM 只讀不寫。這確保你可以隨時回溯、核查。
Key Takeaways
- # Recordings-35-.txt Recordings Andrej Karpathy 最近分享了一個關於 LLM 知識庫的全新思路,引發了極大迴響。傳統做法(RAG)的問題在於:每次提問,AI 都從零開始檢索文件片段,然後重新組織答案。知識沒有積累,每次都在重複勞動。
- Karpathy 提出的替代方案是:讓 LLM 主動建立一個持續維護的 Wiki。這個 Wiki 是一組結構化的 Markdown 文件,由 LLM 全權負責維護。每當有新資料進來,LLM 不是單純索引,而是真的去閱讀、提取關鍵資訊、整合進現有知識體系。更新實體頁面、修訂主題摘要、標記新舊資料的矛盾、補充交叉引用。知識被「編譯」一次,然後持續維護,而不是每次查詢都重新推導。
- 架構分為三層: 第一層 Raw Sources(原始資料):所有原始材料——論文、文章、圖片、數據文件。這層是不可變的,LLM 只讀不寫。這確保你可以隨時回溯、核查。
- 第二層 The Wiki(知識層):由 LLM 完全擁有和維護的 Markdown 文件群。摘要、實體頁面、概念頁面、對比分析、總覽。這不是原始資料的簡單搬運,而是 LLM 在理解、提煉、關聯之後的產物。
- 第三層 The Schema(規則層):配置文件(如 CLAUDE.md 或 AGENTS.md),告訴 LLM Wiki 的結構、約定、處理流程。這是把 LLM 從「通用聊天機器人」變成「有紀律的 Wiki 維護者」的關鍵。
Related: overview.