134 lines
8.8 KiB
Markdown
134 lines
8.8 KiB
Markdown
# 7 уровней Claude Code и RAG
|
||
|
||
**Дата:** 2026-04-29
|
||
**Источник:** [The 7 Levels of Claude Code and RAG](https://www.youtube.com/watch?v=kQu5pWKS8GA)
|
||
**Автор:** Chase AI
|
||
|
||
---
|
||
|
||
## Резюме
|
||
|
||
Видео — это дорожная карта по системам памяти для Claude Code: от встроенных механизмов до продвинутого Graph RAG. Главная идея: большинству людей достаточно Obsidian, а настоящий RAG нужен лишь при работе с тысячами документов и сложными связями между ними. Ключевое напряжение — context rot: чем больше контекст, тем хуже качество ответов. Нужно не накапливать контекст бесконечно, а управлять памятью явно и структурированно.
|
||
|
||
---
|
||
|
||
## Уровни
|
||
|
||
### Уровень 1 — AutoMemory (встроенная память)
|
||
|
||
- Claude Code автоматически создаёт markdown-файлы в `~/.claude/projects/memory/`
|
||
- Сохраняет то, что считает важным — без участия пользователя
|
||
- **Проблема:** люди боятся закрывать окно чата → никогда не сбрасывают контекст → **context rot**
|
||
- Context rot: чем больше заполнен контекст, тем хуже модель работает (пример: 256k из 1M = 92% → 78% эффективность)
|
||
- **Вывод:** automemory недостаточно, нужен явный контроль памяти
|
||
|
||
---
|
||
|
||
### Уровень 2 — CLAUDE.md
|
||
|
||
- Один файл с правилами и контекстом проекта, читается перед каждым промптом
|
||
- Создаётся автоматически, редактируется вручную или через `/init`
|
||
- **Ловушка:** раздутый rulebook — исследования показывают, что переполненный CLAUDE.md снижает качество
|
||
- **Принцип:** меньше = лучше. Если контент не релевантен буквально каждому промпту — ему здесь не место
|
||
- **Вывод:** высокий сигнал, нулевой шум
|
||
|
||
---
|
||
|
||
### Уровень 3 — State Files (множественные markdown-файлы)
|
||
|
||
- Вместо одного CLAUDE.md — несколько специализированных файлов
|
||
- Пример (паттерн GSD/orchestration): `project.md`, `requirements.md`, `roadmap.md`, `state.md`
|
||
- CLAUDE.md становится **индексом**, указывающим на нужный файл
|
||
- Борьба с context rot: инжектируем только релевантный контекст, а не всё подряд
|
||
- **Аналог:** грубая реализация chunking + similarity search из RAG
|
||
- **Ловушка:** файлы привязаны к конкретному проекту, плохо масштабируются между проектами
|
||
|
||
---
|
||
|
||
### Уровень 4 — Obsidian (рекомендуемый уровень для большинства)
|
||
|
||
> 💡 **Для большинства людей — это финальный уровень. Дальше — избыточно.**
|
||
|
||
- Бесплатный инструмент, vault = квази-RAG система из markdown-файлов
|
||
- Архитектура (по Андрею Карпатому):
|
||
- `raw/` — сырые данные (staging area)
|
||
- `wiki/` — структурированные статьи с мастер-индексом
|
||
- `CLAUDE.md` — индекс структуры vault
|
||
- Claude Code ищет: vault → wiki → master index → статья
|
||
- Преимущества: человек видит все связи, бесплатно, нет оверхеда
|
||
- **Когда не хватает:** тысячи документов + нужны сложные relationships + цена/скорость критичны
|
||
- Сравнение: textual RAG vs textual LLM — разница до **1200x** по скорости и стоимости (данные 2025, с тех пор изменилось)
|
||
|
||
---
|
||
|
||
### Уровень 5 — Naive RAG (понять, не внедрять)
|
||
|
||
- Цель уровня — **понять основы**, а не реализовывать
|
||
- Как работает:
|
||
1. **Chunking** — документ делится на чанки
|
||
2. **Embedding** — каждый чанк → вектор через embedding-модель
|
||
3. **Vector DB** — многомерное пространство, похожие по смыслу вещи рядом
|
||
4. **Retrieval** — вопрос тоже превращается в вектор, находятся ближайшие чанки → подаются в LLM
|
||
- **Проблемы naive RAG:**
|
||
- Чанки в изоляции — теряется контекст между ними
|
||
- Нет понимания связей между документами
|
||
- Без reranker — эффективность ~25%
|
||
- **Ловушка:** не покупать "RAG системы" на Pinecone/Supabase без понимания, что это — просто сложный ctrl+F
|
||
|
||
---
|
||
|
||
### Уровень 6 — Graph RAG (LightRAG)
|
||
|
||
- Вместо изолированных векторов — граф связей между сущностями
|
||
- Инструмент: [LightRAG](https://github.com/HKUDS/LightRAG) — open-source, легковесный
|
||
- Производительность vs naive RAG: +100% и более (31→68%, 24→76% и т.д.)
|
||
- Гибридный подход: vector + graph query
|
||
- **Отличие от Obsidian:** связи в Obsidian — ручные и произвольные; в LightRAG — автоматические, на основе реального содержимого
|
||
- **Ловушка:** только текст — нет поддержки PDF, видео, изображений "из коробки"
|
||
|
||
---
|
||
|
||
### Уровень 7 — Agentic RAG (bleeding edge, апрель 2026)
|
||
|
||
- **Multimodal ingestion:** RAGAnything (PDF, изображения, таблицы) + Gemini Embedding 2 (видео)
|
||
- **Agentic routing:** агент сам решает — идти в graph RAG или делать SQL запрос в Postgres
|
||
- **Data pipeline:** Google Drive → ingestion pipeline → LightRAG → логирование
|
||
- Вопросы production: дедупликация, версионирование, права доступа, обновление данных
|
||
- **Рекомендация для solo:** LightRAG + RAGAnything (open-source, легко попробовать и отказаться)
|
||
- **Ловушка:** форсировать этот уровень без реальной необходимости — пустая трата времени
|
||
|
||
---
|
||
|
||
## Ключевые инсайты
|
||
|
||
- **Context rot реален** — никогда не работать в одном окне до заполнения контекста
|
||
- **CLAUDE.md — не дневник** — только то, что нужно в каждом промпте
|
||
- **Obsidian first** — перед любым RAG попробовать Obsidian, он решает 80-99% задач
|
||
- **Понять naive RAG** — без этого нельзя осознанно выбирать более сложные системы
|
||
- **Эксперимент > теория** — никто не скажет тебе заранее, где твой предел масштаба
|
||
- **LightRAG > Microsoft GraphRAG** — дешевле, проще, по бенчмаркам не хуже
|
||
- **Зрелая архитектура:** CLAUDE.md + state files + Obsidian vault + graph RAG + agentic router
|
||
|
||
---
|
||
|
||
## Что применить
|
||
|
||
- [ ] Проверить и почистить свой CLAUDE.md — убрать всё нерелевантное
|
||
- [ ] Попробовать архитектуру с несколькими state-файлами для Pulse App
|
||
- [ ] Obsidian vault уже есть → структурировать по паттерну `raw/` + `wiki/` + master index
|
||
- [ ] Изучить LightRAG если Obsidian начнёт не справляться
|
||
- [ ] Посмотреть видео про RAGAnything + LightRAG связку
|
||
|
||
---
|
||
|
||
## Ресурсы из видео
|
||
|
||
- Видео: André Karpathy — LLM Knowledge Base on Obsidian
|
||
- LightRAG GitHub (Microsoft Graph RAG альтернатива)
|
||
- Chase AI Plus — модуль по production RAG
|
||
- RAGAnything — multimodal ingestion
|
||
|
||
---
|
||
|
||
#claude #rag #ai #dev #obsidian #memory #llm
|