diff --git a/Dev/7-уровней-claude-code-rag.md b/Dev/7-уровней-claude-code-rag.md new file mode 100644 index 0000000..3c90348 --- /dev/null +++ b/Dev/7-уровней-claude-code-rag.md @@ -0,0 +1,133 @@ +# 7 уровней Claude Code и RAG + +**Дата:** 2026-04-29 +**Источник:** [The 7 Levels of Claude Code and RAG](https://www.youtube.com/watch?v=kQu5pWKS8GA) +**Автор:** Chase AI + +--- + +## Резюме + +Видео — это дорожная карта по системам памяти для Claude Code: от встроенных механизмов до продвинутого Graph RAG. Главная идея: большинству людей достаточно Obsidian, а настоящий RAG нужен лишь при работе с тысячами документов и сложными связями между ними. Ключевое напряжение — context rot: чем больше контекст, тем хуже качество ответов. Нужно не накапливать контекст бесконечно, а управлять памятью явно и структурированно. + +--- + +## Уровни + +### Уровень 1 — AutoMemory (встроенная память) + +- Claude Code автоматически создаёт markdown-файлы в `~/.claude/projects/memory/` +- Сохраняет то, что считает важным — без участия пользователя +- **Проблема:** люди боятся закрывать окно чата → никогда не сбрасывают контекст → **context rot** +- Context rot: чем больше заполнен контекст, тем хуже модель работает (пример: 256k из 1M = 92% → 78% эффективность) +- **Вывод:** automemory недостаточно, нужен явный контроль памяти + +--- + +### Уровень 2 — CLAUDE.md + +- Один файл с правилами и контекстом проекта, читается перед каждым промптом +- Создаётся автоматически, редактируется вручную или через `/init` +- **Ловушка:** раздутый rulebook — исследования показывают, что переполненный CLAUDE.md снижает качество +- **Принцип:** меньше = лучше. Если контент не релевантен буквально каждому промпту — ему здесь не место +- **Вывод:** высокий сигнал, нулевой шум + +--- + +### Уровень 3 — State Files (множественные markdown-файлы) + +- Вместо одного CLAUDE.md — несколько специализированных файлов +- Пример (паттерн GSD/orchestration): `project.md`, `requirements.md`, `roadmap.md`, `state.md` +- CLAUDE.md становится **индексом**, указывающим на нужный файл +- Борьба с context rot: инжектируем только релевантный контекст, а не всё подряд +- **Аналог:** грубая реализация chunking + similarity search из RAG +- **Ловушка:** файлы привязаны к конкретному проекту, плохо масштабируются между проектами + +--- + +### Уровень 4 — Obsidian (рекомендуемый уровень для большинства) + +> 💡 **Для большинства людей — это финальный уровень. Дальше — избыточно.** + +- Бесплатный инструмент, vault = квази-RAG система из markdown-файлов +- Архитектура (по Андрею Карпатому): + - `raw/` — сырые данные (staging area) + - `wiki/` — структурированные статьи с мастер-индексом + - `CLAUDE.md` — индекс структуры vault +- Claude Code ищет: vault → wiki → master index → статья +- Преимущества: человек видит все связи, бесплатно, нет оверхеда +- **Когда не хватает:** тысячи документов + нужны сложные relationships + цена/скорость критичны +- Сравнение: textual RAG vs textual LLM — разница до **1200x** по скорости и стоимости (данные 2025, с тех пор изменилось) + +--- + +### Уровень 5 — Naive RAG (понять, не внедрять) + +- Цель уровня — **понять основы**, а не реализовывать +- Как работает: + 1. **Chunking** — документ делится на чанки + 2. **Embedding** — каждый чанк → вектор через embedding-модель + 3. **Vector DB** — многомерное пространство, похожие по смыслу вещи рядом + 4. **Retrieval** — вопрос тоже превращается в вектор, находятся ближайшие чанки → подаются в LLM +- **Проблемы naive RAG:** + - Чанки в изоляции — теряется контекст между ними + - Нет понимания связей между документами + - Без reranker — эффективность ~25% +- **Ловушка:** не покупать "RAG системы" на Pinecone/Supabase без понимания, что это — просто сложный ctrl+F + +--- + +### Уровень 6 — Graph RAG (LightRAG) + +- Вместо изолированных векторов — граф связей между сущностями +- Инструмент: [LightRAG](https://github.com/HKUDS/LightRAG) — open-source, легковесный +- Производительность vs naive RAG: +100% и более (31→68%, 24→76% и т.д.) +- Гибридный подход: vector + graph query +- **Отличие от Obsidian:** связи в Obsidian — ручные и произвольные; в LightRAG — автоматические, на основе реального содержимого +- **Ловушка:** только текст — нет поддержки PDF, видео, изображений "из коробки" + +--- + +### Уровень 7 — Agentic RAG (bleeding edge, апрель 2026) + +- **Multimodal ingestion:** RAGAnything (PDF, изображения, таблицы) + Gemini Embedding 2 (видео) +- **Agentic routing:** агент сам решает — идти в graph RAG или делать SQL запрос в Postgres +- **Data pipeline:** Google Drive → ingestion pipeline → LightRAG → логирование +- Вопросы production: дедупликация, версионирование, права доступа, обновление данных +- **Рекомендация для solo:** LightRAG + RAGAnything (open-source, легко попробовать и отказаться) +- **Ловушка:** форсировать этот уровень без реальной необходимости — пустая трата времени + +--- + +## Ключевые инсайты + +- **Context rot реален** — никогда не работать в одном окне до заполнения контекста +- **CLAUDE.md — не дневник** — только то, что нужно в каждом промпте +- **Obsidian first** — перед любым RAG попробовать Obsidian, он решает 80-99% задач +- **Понять naive RAG** — без этого нельзя осознанно выбирать более сложные системы +- **Эксперимент > теория** — никто не скажет тебе заранее, где твой предел масштаба +- **LightRAG > Microsoft GraphRAG** — дешевле, проще, по бенчмаркам не хуже +- **Зрелая архитектура:** CLAUDE.md + state files + Obsidian vault + graph RAG + agentic router + +--- + +## Что применить + +- [ ] Проверить и почистить свой CLAUDE.md — убрать всё нерелевантное +- [ ] Попробовать архитектуру с несколькими state-файлами для Pulse App +- [ ] Obsidian vault уже есть → структурировать по паттерну `raw/` + `wiki/` + master index +- [ ] Изучить LightRAG если Obsidian начнёт не справляться +- [ ] Посмотреть видео про RAGAnything + LightRAG связку + +--- + +## Ресурсы из видео + +- Видео: André Karpathy — LLM Knowledge Base on Obsidian +- LightRAG GitHub (Microsoft Graph RAG альтернатива) +- Chase AI Plus — модуль по production RAG +- RAGAnything — multimodal ingestion + +--- + +#claude #rag #ai #dev #obsidian #memory #llm