Files
obsidian/Медиа/YouTube/7-уровней-claude-code-rag.md

8.8 KiB
Raw Permalink Blame History

7 уровней Claude Code и RAG

Дата: 2026-04-29 Источник: The 7 Levels of Claude Code and RAG Автор: Chase AI


Резюме

Видео — это дорожная карта по системам памяти для Claude Code: от встроенных механизмов до продвинутого Graph RAG. Главная идея: большинству людей достаточно Obsidian, а настоящий RAG нужен лишь при работе с тысячами документов и сложными связями между ними. Ключевое напряжение — context rot: чем больше контекст, тем хуже качество ответов. Нужно не накапливать контекст бесконечно, а управлять памятью явно и структурированно.


Уровни

Уровень 1 — AutoMemory (встроенная память)

  • Claude Code автоматически создаёт markdown-файлы в ~/.claude/projects/memory/
  • Сохраняет то, что считает важным — без участия пользователя
  • Проблема: люди боятся закрывать окно чата → никогда не сбрасывают контекст → context rot
  • Context rot: чем больше заполнен контекст, тем хуже модель работает (пример: 256k из 1M = 92% → 78% эффективность)
  • Вывод: automemory недостаточно, нужен явный контроль памяти

Уровень 2 — CLAUDE.md

  • Один файл с правилами и контекстом проекта, читается перед каждым промптом
  • Создаётся автоматически, редактируется вручную или через /init
  • Ловушка: раздутый rulebook — исследования показывают, что переполненный CLAUDE.md снижает качество
  • Принцип: меньше = лучше. Если контент не релевантен буквально каждому промпту — ему здесь не место
  • Вывод: высокий сигнал, нулевой шум

Уровень 3 — State Files (множественные markdown-файлы)

  • Вместо одного CLAUDE.md — несколько специализированных файлов
  • Пример (паттерн GSD/orchestration): project.md, requirements.md, roadmap.md, state.md
  • CLAUDE.md становится индексом, указывающим на нужный файл
  • Борьба с context rot: инжектируем только релевантный контекст, а не всё подряд
  • Аналог: грубая реализация chunking + similarity search из RAG
  • Ловушка: файлы привязаны к конкретному проекту, плохо масштабируются между проектами

Уровень 4 — Obsidian (рекомендуемый уровень для большинства)

💡 Для большинства людей — это финальный уровень. Дальше — избыточно.

  • Бесплатный инструмент, vault = квази-RAG система из markdown-файлов
  • Архитектура (по Андрею Карпатому):
    • raw/ — сырые данные (staging area)
    • wiki/ — структурированные статьи с мастер-индексом
    • CLAUDE.md — индекс структуры vault
  • Claude Code ищет: vault → wiki → master index → статья
  • Преимущества: человек видит все связи, бесплатно, нет оверхеда
  • Когда не хватает: тысячи документов + нужны сложные relationships + цена/скорость критичны
  • Сравнение: textual RAG vs textual LLM — разница до 1200x по скорости и стоимости (данные 2025, с тех пор изменилось)

Уровень 5 — Naive RAG (понять, не внедрять)

  • Цель уровня — понять основы, а не реализовывать
  • Как работает:
    1. Chunking — документ делится на чанки
    2. Embedding — каждый чанк → вектор через embedding-модель
    3. Vector DB — многомерное пространство, похожие по смыслу вещи рядом
    4. Retrieval — вопрос тоже превращается в вектор, находятся ближайшие чанки → подаются в LLM
  • Проблемы naive RAG:
    • Чанки в изоляции — теряется контекст между ними
    • Нет понимания связей между документами
    • Без reranker — эффективность ~25%
  • Ловушка: не покупать "RAG системы" на Pinecone/Supabase без понимания, что это — просто сложный ctrl+F

Уровень 6 — Graph RAG (LightRAG)

  • Вместо изолированных векторов — граф связей между сущностями
  • Инструмент: LightRAG — open-source, легковесный
  • Производительность vs naive RAG: +100% и более (31→68%, 24→76% и т.д.)
  • Гибридный подход: vector + graph query
  • Отличие от Obsidian: связи в Obsidian — ручные и произвольные; в LightRAG — автоматические, на основе реального содержимого
  • Ловушка: только текст — нет поддержки PDF, видео, изображений "из коробки"

Уровень 7 — Agentic RAG (bleeding edge, апрель 2026)

  • Multimodal ingestion: RAGAnything (PDF, изображения, таблицы) + Gemini Embedding 2 (видео)
  • Agentic routing: агент сам решает — идти в graph RAG или делать SQL запрос в Postgres
  • Data pipeline: Google Drive → ingestion pipeline → LightRAG → логирование
  • Вопросы production: дедупликация, версионирование, права доступа, обновление данных
  • Рекомендация для solo: LightRAG + RAGAnything (open-source, легко попробовать и отказаться)
  • Ловушка: форсировать этот уровень без реальной необходимости — пустая трата времени

Ключевые инсайты

  • Context rot реален — никогда не работать в одном окне до заполнения контекста
  • CLAUDE.md — не дневник — только то, что нужно в каждом промпте
  • Obsidian first — перед любым RAG попробовать Obsidian, он решает 80-99% задач
  • Понять naive RAG — без этого нельзя осознанно выбирать более сложные системы
  • Эксперимент > теория — никто не скажет тебе заранее, где твой предел масштаба
  • LightRAG > Microsoft GraphRAG — дешевле, проще, по бенчмаркам не хуже
  • Зрелая архитектура: CLAUDE.md + state files + Obsidian vault + graph RAG + agentic router

Что применить

  • Проверить и почистить свой CLAUDE.md — убрать всё нерелевантное
  • Попробовать архитектуру с несколькими state-файлами для Pulse App
  • Obsidian vault уже есть → структурировать по паттерну raw/ + wiki/ + master index
  • Изучить LightRAG если Obsidian начнёт не справляться
  • Посмотреть видео про RAGAnything + LightRAG связку

Ресурсы из видео

  • Видео: André Karpathy — LLM Knowledge Base on Obsidian
  • LightRAG GitHub (Microsoft Graph RAG альтернатива)
  • Chase AI Plus — модуль по production RAG
  • RAGAnything — multimodal ingestion

#claude #rag #ai #dev #obsidian #memory #llm