From b4d35f5139fde272f77127221063700d76e4e50b Mon Sep 17 00:00:00 2001 From: JayWP <2316468683@qq.com> Date: Mon, 13 Apr 2026 18:04:53 +0800 Subject: [PATCH] vault backup: 2026-04-13 18:04:51 --- .claude/skills/kb/README.md | 160 ++++++++ .claude/skills/kb/SKILL.md | 327 +++++++++++++++ .claude/skills/kb/index.html | 381 ++++++++++++++++++ .../skills/kb/scripts/extractors/__init__.py | 0 .../kb/scripts/extractors/docx_extractor.py | 28 ++ .../kb/scripts/extractors/excel_extractor.py | 34 ++ .../kb/scripts/extractors/image_extractor.py | 20 + .../kb/scripts/extractors/pdf_extractor.py | 34 ++ .claude/skills/kb/scripts/ingest.py | 102 +++++ .claude/skills/kb/scripts/requirements.txt | 6 + .claude/skills/kb/templates/MASTER-INDEX.md | 4 + .claude/skills/kb/templates/ONTOLOGY.md | 50 +++ .claude/skills/kb/templates/RAW-REGISTRY.md | 4 + .claude/skills/kb/templates/TOPIC-MAP.md | 3 + .../conv-1776074446367-y9l6jom6z.meta.json | 23 ++ .obsidian/community-plugins.json | 3 +- .obsidian/plugins/claudian/data.json | 11 + ...¼Œå‘Šåˆ« RAG 幻觉?我åšäº†ä¸€ä¸ªå·¥å…·ï¼ŒæŠŠè¿™å¥—方法è½åœ°äº†.md | 0 ok.md | 1 - 未命å.canvas | 1 - 20 files changed, 1189 insertions(+), 3 deletions(-) create mode 100644 .claude/skills/kb/README.md create mode 100644 .claude/skills/kb/SKILL.md create mode 100644 .claude/skills/kb/index.html create mode 100644 .claude/skills/kb/scripts/extractors/__init__.py create mode 100644 .claude/skills/kb/scripts/extractors/docx_extractor.py create mode 100644 .claude/skills/kb/scripts/extractors/excel_extractor.py create mode 100644 .claude/skills/kb/scripts/extractors/image_extractor.py create mode 100644 .claude/skills/kb/scripts/extractors/pdf_extractor.py create mode 100644 .claude/skills/kb/scripts/ingest.py create mode 100644 .claude/skills/kb/scripts/requirements.txt create mode 100644 .claude/skills/kb/templates/MASTER-INDEX.md create mode 100644 .claude/skills/kb/templates/ONTOLOGY.md create mode 100644 .claude/skills/kb/templates/RAW-REGISTRY.md create mode 100644 .claude/skills/kb/templates/TOPIC-MAP.md create mode 100644 .claudian/sessions/conv-1776074446367-y9l6jom6z.meta.json create mode 100644 .obsidian/plugins/claudian/data.json rename 测试.md => Karpathy 让 AI 自己管知识库,告别 RAG 幻觉?我åšäº†ä¸€ä¸ªå·¥å…·ï¼ŒæŠŠè¿™å¥—方法è½åœ°äº†.md (100%) delete mode 100644 ok.md delete mode 100644 未命å.canvas diff --git a/.claude/skills/kb/README.md b/.claude/skills/kb/README.md new file mode 100644 index 0000000..6ab7051 --- /dev/null +++ b/.claude/skills/kb/README.md @@ -0,0 +1,160 @@ +# /kb — LLM 知识库管ç†å·¥å…· + +基于 Karpathy çš„ LLM Knowledge Base 模å¼ï¼šraw/ å˜åŽŸå§‹èµ„æ–™ï¼ŒLLM ç¼–è¯‘æˆ wiki/,索引替代 RAG。 + +## 快速开始 + +### 1. åˆå§‹åŒ–知识库 + +``` +/kb init +``` + +在当å‰ç›®å½•创建知识库目录结构: +- `raw/` — 原始资料(åªè¯»ï¼‰ +- `wiki/concepts/` — æ ¸å¿ƒæ¦‚å¿µ +- `wiki/sources/` — æ¥æºæ‘˜è¦ +- `wiki/comparisons/` — å¯¹æ¯”åˆ†æž +- `output/analysis/` — åˆ†æžæŠ¥å‘Š +- `output/slides/` — å¹»ç¯ç‰‡ +- `index/` — 索引文件 + +### 2. 导入文件 + +å°† PDFã€Excelã€å›¾ç‰‡ã€Word 文档放入 `raw/` 目录,然åŽï¼š + +``` +/kb ingest +``` + +自动æå–文本并登记到索引。 + +### 3. 编译为 Wiki + +``` +/kb compile +``` + +LLM 读å–原料,生æˆç»“构化 wiki æ–‡ç« ã€‚ + +### 4. 查询知识库 + +``` +/kb query "ä½ çš„é—®é¢˜" +``` + +生æˆç»“构化报告,包å«åˆ†æžã€ç»“论和回填建议。 + +### 5. 回填有价值的结果 + +``` +/kb file +``` + +å°†æŸ¥è¯¢æŠ¥å‘Šä¸æœ‰ä»·å€¼çš„内容并入 wiki。 + +### 6. å¥åº·æ£€æŸ¥ + +``` +/kb lint +``` + +å…项检查:æ–链ã€å¤å²›ã€æº¯æºã€ä¸€è‡´æ€§ã€è¦†ç›–度ã€ç©ºç™½å‘现。 + +### 7. æŸ¥çœ‹çŠ¶æ€ + +``` +/kb status +``` + +仪表盘展示整体å¥åº·åº¦å’Œç»Ÿè®¡ä¿¡æ¯ã€‚ + +--- + +## å命令速查 + +| 命令 | 功能 | 触å‘è¯ | +|------|------|--------| +| `kb init [目录]` | åˆå§‹åŒ–知识库 | "åˆå§‹åŒ–"ã€"创建知识库" | +| `kb ingest` | é¢„å¤„ç† raw/ 文件 | "导入"ã€"å¤„ç†æ–°æ–‡ä»¶" | +| `kb compile [文件]` | 编译为 wiki | "编译"ã€"æ›´æ–° wiki" | +| `kb query "<问题>"` | 查询知识库 | "查知识库"ã€"问知识库" | +| `kb file [报告]` | 回填到 wiki | "回填"ã€"å½’æ¡£" | +| `kb lint` | å¥åº·æ£€æŸ¥ | "检查"ã€"lint" | +| `kb status` | 状æ€ä»ªè¡¨ç›˜ | "状æ€"ã€"看看知识库" | + +--- + +## 支æŒçš„æ–‡ä»¶æ ¼å¼ + +| æ ¼å¼ | åŽç¼€ | 说明 | +|------|------|------| +| PDF | .pdf | æå–文本和图片 | +| Excel | .xlsx, .xls, .csv | æå–è¡¨æ ¼å†…å®¹ | +| 图片 | .png, .jpg, .jpeg | OCR æ–‡å—识别 | +| Word | .docx | æå–段è½å’Œè¡¨æ ¼ | + +--- + +## 工作æµç¨‹ + +``` +投喂原料 LLM 编译 查询使用 + │ │ │ + â–¼ â–¼ â–¼ + raw/ ──────► wiki/ ──────► æŸ¥è¯¢åˆ†æž â”€â”€â”€â”€â”€â”€â–º 回填 + │ │ │ + 原始文件 ç»“æž„åŒ–æ–‡ç« çŸ¥è¯†å¢žé•¿ +``` + +--- + +## 目录结构 + +``` +{çŸ¥è¯†åº“æ ¹ç›®å½•}/ +├── raw/ # 原始资料(åªè¯»ï¼‰ +│ └── .extracted/ # æå–的文本(自动生æˆï¼‰ +├── wiki/ +│ ├── concepts/ # æ ¸å¿ƒæ¦‚å¿µ +│ ├── sources/ # æ¥æºæ‘˜è¦ +│ └── comparisons/ # å¯¹æ¯”åˆ†æž +├── output/ +│ ├── analysis/ # 查询报告 +│ └── slides/ # å¹»ç¯ç‰‡ +├── index/ +│ ├── MASTER-INDEX.md # 全局索引 +│ ├── TOPIC-MAP.md # 主题分组 +│ ├── RAW-REGISTRY.md # 原始文件登记 +│ ├── LINT-REPORT.md # å¥åº·æ£€æŸ¥æŠ¥å‘Š +│ └── ONTOLOGY.md # 本体定义 +└── scripts/ + ├── ingest.py # 预处ç†è„šæœ¬ + └── extractors/ # 文件æå–器 +``` + +--- + +## Python ä¾èµ– + +首次使用需è¦å®‰è£…ä¾èµ–: + +```bash +pip install -r .claude/skills/kb/scripts/requirements.txt +``` + +ä¾èµ–列表: +- PyMuPDF — PDF æå– +- openpyxl — Excel è¯»å– +- pandas — æ•°æ®å¤„ç† +- pytesseract — 图片 OCR +- python-docx — Word è¯»å– +- Pillow — å›¾ç‰‡å¤„ç† + +--- + +## SessionStart Hook(å¯é€‰ï¼‰ + +é…ç½®åŽï¼Œæ¯æ¬¡æ‰“å¼€ Claude Code 会自动检测 `raw/` ä¸çš„æ–°æ–‡ä»¶å¹¶æé†’处ç†ã€‚ + +åˆå§‹åŒ–时选择"是"å³å¯å¯ç”¨ã€‚ diff --git a/.claude/skills/kb/SKILL.md b/.claude/skills/kb/SKILL.md new file mode 100644 index 0000000..40dfca1 --- /dev/null +++ b/.claude/skills/kb/SKILL.md @@ -0,0 +1,327 @@ +--- +name: kb +description: | + LLM 驱动的知识库管ç†å·¥å…·ç®±ã€‚当用户说"kb"ã€"知识库"ã€"查知识库"ã€"åˆå§‹åŒ–知识库"ã€"导入文件"ã€"编译"ã€"回填"ç‰æ—¶è§¦å‘。 + 支æŒå¯¹ vault æˆ–å¤–éƒ¨ç›®å½•å»ºç«‹çŸ¥è¯†åº“ï¼šé¢„å¤„ç†æ–‡ä»¶ã€ç¼–译 wikiã€æŸ¥è¯¢åˆ†æžã€å¥åº·æ£€æŸ¥ã€‚ + 基于 Karpathy çš„ LLM Knowledge Base 模å¼ï¼šraw/ å˜åŽŸå§‹èµ„æ–™ï¼ŒLLM ç¼–è¯‘æˆ wiki/,索引替代 RAG。 +user-invocable: true +--- + +# /kb — LLM çŸ¥è¯†åº“ç®¡ç† + +统一入å£ï¼ŒåŒ…å« 7 个å命令。 + +## å命令速查 + +| 命令 | 功能 | 触å‘è¯ | +|------|------|--------| +| `kb init [目录]` | åˆå§‹åŒ–知识库 | "åˆå§‹åŒ–"ã€"创建知识库" | +| `kb ingest` | é¢„å¤„ç† raw/ 文件 | "导入"ã€"å¤„ç†æ–°æ–‡ä»¶" | +| `kb compile [文件]` | 编译为 wiki | "编译"ã€"æ›´æ–° wiki" | +| `kb query "<问题>"` | 查询知识库 | "查知识库"ã€"问知识库" | +| `kb file [报告]` | 回填到 wiki | "回填"ã€"å½’æ¡£" | +| `kb lint` | å¥åº·æ£€æŸ¥ | "检查"ã€"lint" | +| `kb status` | 状æ€ä»ªè¡¨ç›˜ | "状æ€"ã€"看看知识库" | + +--- + +## kb init [ç›®æ ‡ç›®å½•] + +åˆå§‹åŒ–知识库目录结构ã€ç´¢å¼•和本体定义。 + +**傿•°**:å¯é€‰ç›®æ ‡ç›®å½•,默认当å‰ç›®å½•(vault)或指定外部目录。 + +### 执行æ¥éª¤ + +1. **检查现有知识库**:查找 `{target}/index/MASTER-INDEX.md`,如果å˜åœ¨åˆ™è¦å‘Šå¹¶ç‰å¾…确认 + +2. **创建目录结构**: + ``` + {target}/raw/ — 原始资料(åªè¯»ï¼‰ + {target}/wiki/concepts/ — æ ¸å¿ƒæ¦‚å¿µ + {target}/wiki/sources/ — æ¥æºæ‘˜è¦ + {target}/wiki/comparisons/ — å¯¹æ¯”åˆ†æž + {target}/output/analysis/ — åˆ†æžæŠ¥å‘Š + {target}/output/slides/ — å¹»ç¯ç‰‡ + {target}/index/ — 索引文件 + {target}/scripts/ — 预处ç†è„šæœ¬ + ``` + +3. **å¤åˆ¶æ¨¡æ¿æ–‡ä»¶**:从本 Skill çš„ `templates/` 目录å¤åˆ¶åˆ° `{target}/index/`: + - ONTOLOGY.md — 实体类型和关系定义 + - MASTER-INDEX.md — 全局索引 + - TOPIC-MAP.md — 主题分组 + - RAW-REGISTRY.md — 原始文件登记 + +4. **å¤åˆ¶è„šæœ¬**:从本 Skill çš„ `scripts/` 目录å¤åˆ¶åˆ° `{target}/scripts/` + +5. **检查 Python ä¾èµ–**: + ```bash + pip show pymupdf openpyxl pandas pytesseract python-docx Pillow 2>&1 + ``` + 报告缺失的包,询问是å¦å®‰è£… + +6. **é…ç½® SessionStart Hook(å¯é€‰ï¼‰**:询问是å¦é…置,检测 raw/ 新文件时æé†’ + +7. **输出åˆå§‹åŒ–摘è¦** + +--- + +## kb ingest + +é¢„å¤„ç† raw/ ä¸çš„æ–°æ–‡ä»¶å¹¶ç™»è®°åˆ°ç´¢å¼•。 + +**å‰ç½®æ¡ä»¶**:知识库已åˆå§‹åŒ–(å˜åœ¨ index/RAW-REGISTRY.md) + +### æ”¯æŒæ ¼å¼ +- PDF (.pdf) +- Excel (.xlsx, .xls, .csv) +- 图片 (.png, .jpg, .jpeg) — OCR æå– +- Word (.docx) + +### 执行æ¥éª¤ + +1. **定ä½çŸ¥è¯†åº“**:å‘上查找 `index/RAW-REGISTRY.md` + +2. **è¿è¡Œé¢„处ç†è„šæœ¬**: + ```bash + python3 {skill_dir}/scripts/ingest.py {kb_root} + ``` + è„šæœ¬è‡ªåŠ¨ï¼šæ‰«ææ–°æ–‡ä»¶ → 按类型æå–文本 → è¾“å‡ºæ‘˜è¦ + +3. **登记到 RAW-REGISTRY.md**:为æ¯ä¸ªæ–°æ–‡ä»¶æ·»åŠ æ¡ç›®ï¼š + - 文件路径ã€ç±»åž‹ã€æ‘˜è¦ï¼ˆä¸€å¥è¯ï¼‰ + - 状æ€ï¼š`pending`(待编译) + +4. **输出摘è¦**:报告导入数é‡ï¼Œæç¤ºä¸‹ä¸€æ¥ `/kb-compile` + +--- + +## kb compile [文件] + +å°† raw/ ä¸å·²å¯¼å…¥ä½†æœªç¼–译的文件编译为 wiki æ–‡ç« ã€‚ + +**傿•°**:å¯é€‰æŒ‡å®šæ–‡ä»¶ï¼Œé»˜è®¤å¤„ç†æ‰€æœ‰ `status=pending` çš„æ¡ç›® + +### æ ¸å¿ƒåŽŸåˆ™ +- Wiki æ–‡ç« ç”± LLM 生æˆï¼Œéµå¾ª ONTOLOGY.md 定义 +- æ¯ç¯‡æ–‡ç« 必须有完整 YAML frontmatter +- 使用 `[[åŒé“¾]]` å»ºç«‹å…³è” +- 编译是增é‡çš„ + +### 执行æ¥éª¤ + +1. **检查待编译æ¡ç›®**:读 `index/RAW-REGISTRY.md`,找 `status=pending` çš„æ¡ç›® + - å¦‚æžœæ²¡æœ‰ï¼Œå‘ŠçŸ¥ç”¨æˆ·å¹¶ç»“æŸ + +2. **åŠ è½½ä¸Šä¸‹æ–‡**:读 ONTOLOGY.mdã€MASTER-INDEX.mdã€TOPIC-MAP.md + +3. **é€ä¸ªç¼–译**: + - è¯»å–æºæ–‡ä»¶æˆ– `raw/.extracted/` 下的æå–文本 + - åˆ¤æ–æ“作:新建 / 更新已有 / 综åˆåˆ†æž + - 按模æ¿ç”Ÿæˆ wiki æ–‡ç« + - æ›´æ–° frontmatter(type, id, compiled_from, related, last_compiled) + - 用 `[[åŒé“¾]]` é“¾æŽ¥ç›¸å…³æ–‡ç« + +4. **更新索引**: + - MASTER-INDEX.md æ·»åŠ /æ›´æ–°æ¡ç›® + - TOPIC-MAP.md 归入主题 + - RAW-REGISTRY.md çŠ¶æ€æ”¹ä¸º `done`,填编译产物路径 + +5. **输出编译摘è¦** + +--- + +## kb query "<问题>" + +对知识库æé—®ï¼Œç”Ÿæˆç»“构化报告。 + +**傿•°**:必填,用户的问题 + +### 执行æ¥éª¤ + +1. **定ä½çŸ¥è¯†åº“**:查找 `index/MASTER-INDEX.md` + +2. **æ£€ç´¢ç›¸å…³æ–‡ç« **: + - 读 MASTER-INDEX.md 定ä½ç›¸å…³æ–‡ä»¶ + - 按需读 TOPIC-MAP.md ç²¾ç¡®å®šä½ + - è¯»å–æ‰€æœ‰ç›¸å…³ wiki æ–‡ç« å†…å®¹ + +3. **ç ”ç©¶åˆ†æž**: + - 基于 wiki 内容深入分æžé—®é¢˜ + - 交å‰å¯¹æ¯”å¤šç¯‡æ–‡ç« + - ç»“è®ºå¿…é¡»åŸºäºŽå®žé™…å†…å®¹ï¼Œæ ‡æ³¨æ¥æº + +4. **ç”ŸæˆæŠ¥å‘Š**:ä¿å˜åˆ° `output/analysis/YYYY-MM-DD-{topic-slug}.md`: + ```markdown + # {æŠ¥å‘Šæ ‡é¢˜} + + - **Date**: YYYY-MM-DD + - **Query**: {用户问题} + - **Sources**: {引用的 wiki æ–‡ç« } + + --- + + ## åˆ†æž + {详细分æžï¼Œå¼•ç”¨å…·ä½“æ–‡ç« ç”¨ [[åŒé“¾]]} + + ## 结论 + {æ ¸å¿ƒå‘现} + + ## 回填建议 + - [ ] {具体建议} + ``` + +5. **输出结果**:展示摘è¦ï¼Œæç¤ºå¯è¿è¡Œ `/kb file` 回填 + +--- + +## kb file [报告路径] + +将查询输出回填到 wiki 知识库。 + +**傿•°**:å¯é€‰æŒ‡å®š output/ 下的报告文件,默认扫æ `output/analysis/` + +### 执行æ¥éª¤ + +1. **定ä½çŸ¥è¯†åº“和待回填内容** + +2. **展示回填建议**:列出所有建议,编å·è¯´æ˜Ž + +3. **用户确认**ï¼šé€æ¡ Y/N æˆ–æ‰¹é‡æ“作 + +4. **执行回填**: + - **æ›´æ–°å·²æœ‰æ–‡ç« **:将新内容有机èžå…¥ + - **æ–°å»ºæ–‡ç« **:按 ONTOLOGY.md 模æ¿åˆ›å»º + +5. **更新索引**:MASTER-INDEX.md å’Œ TOPIC-MAP.md + +6. **输出摘è¦** + +--- + +## kb lint + +对知识库进行å…项å¥åº·æ£€æŸ¥ã€‚ + +### 检查项目 + +| 检查 | 说明 | +|------|------| +| æ–链 | `[[链接]]` 指å‘ä¸å˜åœ¨çš„æ–‡ä»¶ | +| å¤å²› | æ²¡æœ‰è¢«ä»»ä½•æ–‡ç« é“¾æŽ¥çš„æ–‡ç« | +| æº¯æº | frontmatter compiled_from 指å‘å·²åˆ é™¤çš„æ–‡ä»¶ | +| 一致性 | åŒä¸€æ¦‚念在ä¸åŒæ–‡ç« ä¸çš„矛盾æè¿° | +| 覆盖度 | 未编译文件比例 | +| 空白å‘现 | 被æåŠä½†æ²¡æœ‰ç‹¬ç«‹æ–‡ç« 的概念 | + +### 执行æ¥éª¤ + +1. **定ä½çŸ¥è¯†åº“** + +2. **执行å…项检查** + +3. **输出 Lint 报告**(按严é‡ç¨‹åº¦æŽ’åºï¼‰ + +4. **æä¾›ä¿®å¤é€‰é¡¹**:å¯è‡ªåŠ¨ä¿®å¤çš„é—®é¢˜è¯¢é—®æ˜¯å¦æ‰§è¡Œ + +5. **ä¿å˜æŠ¥å‘Šåˆ° `index/LINT-REPORT.md`** + +--- + +## kb status + +展示知识库整体状æ€ä»ªè¡¨ç›˜ã€‚ + +### 执行æ¥éª¤ + +1. **定ä½çŸ¥è¯†åº“** + +2. **收集统计数æ®**: + - raw/ 文件数 + - wiki/ æ–‡ç« æ•°å’Œå—æ•° + - 编译率 + - 待回填报告数 + - 上次 lint 结果 + +3. **展示仪表盘**: + ``` + çŸ¥è¯†åº“çŠ¶æ€ + â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â• + 原始文件: N 个 + Wiki æ–‡ç« : M 篇 (å…± ~X å—) + 编译率: XX% + 待回填: Y 份报告 + 上次 Lint: 日期 — é—®é¢˜æ‘˜è¦ + â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â•â• + + æœ€è¿‘ç¼–è¯‘çš„æ–‡ç« : + - wiki/concepts/xxx.md (日期) + + 待处ç†: + - N 个文件待编译 → /kb compile + - M 份报告待回填 → /kb file + ``` + +4. **å»ºè®®ä¸‹ä¸€æ¥æ“作** + +--- + +## 目录结构约定 + +``` +{çŸ¥è¯†åº“æ ¹ç›®å½•}/ +├── raw/ # 原始资料(åªè¯»ï¼‰ +│ └── .extracted/ # æå–的文本(自动生æˆï¼‰ +├── wiki/ +│ ├── concepts/ # æ ¸å¿ƒæ¦‚å¿µ +│ ├── sources/ # æ¥æºæ‘˜è¦ +│ └── comparisons/ # å¯¹æ¯”åˆ†æž +├── output/ +│ ├── analysis/ # 查询报告 +│ └── slides/ # å¹»ç¯ç‰‡ +├── index/ +│ ├── MASTER-INDEX.md # 全局索引 +│ ├── TOPIC-MAP.md # 主题分组 +│ ├── RAW-REGISTRY.md # 原始文件登记 +│ ├── LINT-REPORT.md # å¥åº·æ£€æŸ¥æŠ¥å‘Š +│ └── ONTOLOGY.md # 本体定义 +└── scripts/ + ├── ingest.py # 预处ç†è„šæœ¬ + ├── requirements.txt # Python ä¾èµ– + └── extractors/ # å„类文件æå–器 +``` + +## 实体类型(ONTOLOGY.md) + +| 类型 | 目录 | 命å规则 | +|------|------|----------| +| concept | wiki/concepts/ | {slug}.md | +| source | wiki/sources/ | {slug}.md | +| comparison | wiki/comparisons/ | {a}-vs-{b}.md | + +## Wiki æ–‡ç« Frontmatter æ¨¡æ¿ + +```yaml +--- +type: concept +id: {slug} +aliases: [] +compiled_from: + - raw/{source_file} +related: + - "[[other-article]]" +last_compiled: YYYY-MM-DD +--- +``` + +--- + +## 故障排除 + +| 问题 | 解决方案 | +|------|----------| +| 找ä¸åˆ°çŸ¥è¯†åº“ | å…ˆè¿è¡Œ `/kb init` åˆå§‹åŒ– | +| 脚本报错 | è¿è¡Œ `pip install -r scripts/requirements.txt` | +| 编译率低 | è¿è¡Œ `/kb ingest` å¯¼å…¥æ–°æ–‡ä»¶ï¼Œç„¶åŽ `/kb compile` | +| æ–链太多 | è¿è¡Œ `/kb lint` æŸ¥çœ‹è¯¦æƒ…ï¼Œæ‰‹åŠ¨ä¿®å¤æˆ–åˆ é™¤æ–链 | diff --git a/.claude/skills/kb/index.html b/.claude/skills/kb/index.html new file mode 100644 index 0000000..7fc9926 --- /dev/null +++ b/.claude/skills/kb/index.html @@ -0,0 +1,381 @@ + + +
+ + +基于 Karpathy çš„ LLM Knowledge Base 模å¼ï¼šraw/ å˜åŽŸå§‹èµ„æ–™ï¼ŒLLM ç¼–è¯‘æˆ wiki/,索引替代 RAG。
+ +在当å‰ç›®å½•创建知识库目录结构:
+ ++├── raw/ # 原始资料(åªè¯»ï¼‰ +├── wiki/ +│ ├── concepts/ # æ ¸å¿ƒæ¦‚å¿µ +│ ├── sources/ # æ¥æºæ‘˜è¦ +│ └── comparisons/ # å¯¹æ¯”åˆ†æž +├── output/ +│ ├── analysis/ # åˆ†æžæŠ¥å‘Š +│ └── slides/ # å¹»ç¯ç‰‡ +└── index/ # 索引文件 ++
å°† PDFã€Excelã€å›¾ç‰‡ã€Word 文档放入 raw/ 目录,然åŽï¼š
自动æå–文本并登记到索引。
+ +LLM 读å–原料,生æˆç»“构化 wiki æ–‡ç« ã€‚
+ +生æˆç»“构化报告,包å«åˆ†æžã€ç»“论和回填建议。
+ +å°†æŸ¥è¯¢æŠ¥å‘Šä¸æœ‰ä»·å€¼çš„内容并入 wiki。
+ +å…项检查:æ–链ã€å¤å²›ã€æº¯æºã€ä¸€è‡´æ€§ã€è¦†ç›–度ã€ç©ºç™½å‘现。
+ +仪表盘展示整体å¥åº·åº¦å’Œç»Ÿè®¡ä¿¡æ¯ã€‚
+ +| 命令 | +功能 | +触å‘è¯ | +
|---|---|---|
kb init [目录] |
+ åˆå§‹åŒ–知识库 | +åˆå§‹åŒ–ã€åˆ›å»ºçŸ¥è¯†åº“ | +
kb ingest |
+ é¢„å¤„ç† raw/ 文件 | +导入ã€å¤„ç†æ–°æ–‡ä»¶ | +
kb compile [文件] |
+ 编译为 wiki | +ç¼–è¯‘ã€æ›´æ–° wiki | +
kb query "<问题>" |
+ 查询知识库 | +查知识库ã€é—®çŸ¥è¯†åº“ | +
kb file [报告] |
+ 回填到 wiki | +回填ã€å½’æ¡£ | +
kb lint |
+ å¥åº·æ£€æŸ¥ | +检查ã€lint | +
kb status |
+ 状æ€ä»ªè¡¨ç›˜ | +状æ€ã€çœ‹çœ‹çŸ¥è¯†åº“ | +
| æ ¼å¼ | +åŽç¼€ | +说明 | +
|---|---|---|
| æå–文本和图片 | +||
| Excel | +.xlsx, .xls, .csv | +æå–è¡¨æ ¼å†…å®¹ | +
| 图片 | +.png, .jpg, .jpeg | +OCR æ–‡å—识别 | +
| Word | +.docx | +æå–段è½å’Œè¡¨æ ¼ | +
+{çŸ¥è¯†åº“æ ¹ç›®å½•}/
+├── raw/ # 原始资料(åªè¯»ï¼‰
+│ └── .extracted/ # æå–的文本(自动生æˆï¼‰
+├── wiki/
+│ ├── concepts/ # æ ¸å¿ƒæ¦‚å¿µ
+│ ├── sources/ # æ¥æºæ‘˜è¦
+│ └── comparisons/ # 对比分æž
+├── output/
+│ ├── analysis/ # 查询报告
+│ └── slides/ # å¹»ç¯ç‰‡
+├── index/
+│ ├── MASTER-INDEX.md # 全局索引
+│ ├── TOPIC-MAP.md # 主题分组
+│ ├── RAW-REGISTRY.md # 原始文件登记
+│ ├── LINT-REPORT.md # å¥åº·æ£€æŸ¥æŠ¥å‘Š
+│ └── ONTOLOGY.md # 本体定义
+└── scripts/
+ ├── ingest.py # 预处ç†è„šæœ¬
+ └── extractors/ # 文件æå–器
+
+
+ 首次使用需è¦å®‰è£…ä¾èµ–:
+é…ç½®åŽï¼Œæ¯æ¬¡æ‰“å¼€ Claude Code 会自动检测 raw/ ä¸çš„æ–°æ–‡ä»¶å¹¶æé†’处ç†ã€‚
åˆå§‹åŒ–时选择"是"å³å¯å¯ç”¨ã€‚
+ + +