Files
obsidian/Медиа/YouTube/7-уровней-claude-code-rag.md

134 lines
8.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 7 уровней Claude Code и RAG
**Дата:** 2026-04-29
**Источник:** [The 7 Levels of Claude Code and RAG](https://www.youtube.com/watch?v=kQu5pWKS8GA)
**Автор:** Chase AI
---
## Резюме
Видео — это дорожная карта по системам памяти для Claude Code: от встроенных механизмов до продвинутого Graph RAG. Главная идея: большинству людей достаточно Obsidian, а настоящий RAG нужен лишь при работе с тысячами документов и сложными связями между ними. Ключевое напряжение — context rot: чем больше контекст, тем хуже качество ответов. Нужно не накапливать контекст бесконечно, а управлять памятью явно и структурированно.
---
## Уровни
### Уровень 1 — AutoMemory (встроенная память)
- Claude Code автоматически создаёт markdown-файлы в `~/.claude/projects/memory/`
- Сохраняет то, что считает важным — без участия пользователя
- **Проблема:** люди боятся закрывать окно чата → никогда не сбрасывают контекст → **context rot**
- Context rot: чем больше заполнен контекст, тем хуже модель работает (пример: 256k из 1M = 92% → 78% эффективность)
- **Вывод:** automemory недостаточно, нужен явный контроль памяти
---
### Уровень 2 — CLAUDE.md
- Один файл с правилами и контекстом проекта, читается перед каждым промптом
- Создаётся автоматически, редактируется вручную или через `/init`
- **Ловушка:** раздутый rulebook — исследования показывают, что переполненный CLAUDE.md снижает качество
- **Принцип:** меньше = лучше. Если контент не релевантен буквально каждому промпту — ему здесь не место
- **Вывод:** высокий сигнал, нулевой шум
---
### Уровень 3 — State Files (множественные markdown-файлы)
- Вместо одного CLAUDE.md — несколько специализированных файлов
- Пример (паттерн GSD/orchestration): `project.md`, `requirements.md`, `roadmap.md`, `state.md`
- CLAUDE.md становится **индексом**, указывающим на нужный файл
- Борьба с context rot: инжектируем только релевантный контекст, а не всё подряд
- **Аналог:** грубая реализация chunking + similarity search из RAG
- **Ловушка:** файлы привязаны к конкретному проекту, плохо масштабируются между проектами
---
### Уровень 4 — Obsidian (рекомендуемый уровень для большинства)
> 💡 **Для большинства людей — это финальный уровень. Дальше — избыточно.**
- Бесплатный инструмент, vault = квази-RAG система из markdown-файлов
- Архитектура (по Андрею Карпатому):
- `raw/` — сырые данные (staging area)
- `wiki/` — структурированные статьи с мастер-индексом
- `CLAUDE.md` — индекс структуры vault
- Claude Code ищет: vault → wiki → master index → статья
- Преимущества: человек видит все связи, бесплатно, нет оверхеда
- **Когда не хватает:** тысячи документов + нужны сложные relationships + цена/скорость критичны
- Сравнение: textual RAG vs textual LLM — разница до **1200x** по скорости и стоимости (данные 2025, с тех пор изменилось)
---
### Уровень 5 — Naive RAG (понять, не внедрять)
- Цель уровня — **понять основы**, а не реализовывать
- Как работает:
1. **Chunking** — документ делится на чанки
2. **Embedding** — каждый чанк → вектор через embedding-модель
3. **Vector DB** — многомерное пространство, похожие по смыслу вещи рядом
4. **Retrieval** — вопрос тоже превращается в вектор, находятся ближайшие чанки → подаются в LLM
- **Проблемы naive RAG:**
- Чанки в изоляции — теряется контекст между ними
- Нет понимания связей между документами
- Без reranker — эффективность ~25%
- **Ловушка:** не покупать "RAG системы" на Pinecone/Supabase без понимания, что это — просто сложный ctrl+F
---
### Уровень 6 — Graph RAG (LightRAG)
- Вместо изолированных векторов — граф связей между сущностями
- Инструмент: [LightRAG](https://github.com/HKUDS/LightRAG) — open-source, легковесный
- Производительность vs naive RAG: +100% и более (31→68%, 24→76% и т.д.)
- Гибридный подход: vector + graph query
- **Отличие от Obsidian:** связи в Obsidian — ручные и произвольные; в LightRAG — автоматические, на основе реального содержимого
- **Ловушка:** только текст — нет поддержки PDF, видео, изображений "из коробки"
---
### Уровень 7 — Agentic RAG (bleeding edge, апрель 2026)
- **Multimodal ingestion:** RAGAnything (PDF, изображения, таблицы) + Gemini Embedding 2 (видео)
- **Agentic routing:** агент сам решает — идти в graph RAG или делать SQL запрос в Postgres
- **Data pipeline:** Google Drive → ingestion pipeline → LightRAG → логирование
- Вопросы production: дедупликация, версионирование, права доступа, обновление данных
- **Рекомендация для solo:** LightRAG + RAGAnything (open-source, легко попробовать и отказаться)
- **Ловушка:** форсировать этот уровень без реальной необходимости — пустая трата времени
---
## Ключевые инсайты
- **Context rot реален** — никогда не работать в одном окне до заполнения контекста
- **CLAUDE.md — не дневник** — только то, что нужно в каждом промпте
- **Obsidian first** — перед любым RAG попробовать Obsidian, он решает 80-99% задач
- **Понять naive RAG** — без этого нельзя осознанно выбирать более сложные системы
- **Эксперимент > теория** — никто не скажет тебе заранее, где твой предел масштаба
- **LightRAG > Microsoft GraphRAG** — дешевле, проще, по бенчмаркам не хуже
- **Зрелая архитектура:** CLAUDE.md + state files + Obsidian vault + graph RAG + agentic router
---
## Что применить
- [ ] Проверить и почистить свой CLAUDE.md — убрать всё нерелевантное
- [ ] Попробовать архитектуру с несколькими state-файлами для Pulse App
- [ ] Obsidian vault уже есть → структурировать по паттерну `raw/` + `wiki/` + master index
- [ ] Изучить LightRAG если Obsidian начнёт не справляться
- [ ] Посмотреть видео про RAGAnything + LightRAG связку
---
## Ресурсы из видео
- Видео: André Karpathy — LLM Knowledge Base on Obsidian
- LightRAG GitHub (Microsoft Graph RAG альтернатива)
- Chase AI Plus — модуль по production RAG
- RAGAnything — multimodal ingestion
---
#claude #rag #ai #dev #obsidian #memory #llm