Files
obsidian/Медиа/YouTube/lichnaya-wiki-na-baze-llm-karpathy.md

7.1 KiB
Raw Blame History

Личная Wiki на базе LLM — практические кейсы по Карпатому

Дата: 2026-04-29 Источник: YouTube Теги: #llm #wiki #rag #ai


Резюме

Видео разбирает практическое применение концепции LLM Wiki от Андрея Карпатого — альтернативы классическому RAG-подходу. В отличие от RAG, где документы делятся на чанки и ищутся по векторному сходству, LLM Wiki сохраняет полный контекст через связанные текстовые файлы с кросс-референсами. Система строится в Obsidian с Claude Code и состоит из трёх каталогов: сырых данных, wiki-файлов и схемы инструкций. Автор демонстрирует реальный кейс на примере анализа рабочего Slack-чата команды.


Ключевые концепции

Архитектура LLM Wiki

Три каталога:

  • raw/ — сырые входящие данные (PDF, Word, txt, чаты)
  • wiki/ — текстовые Markdown-файлы, генерируемые нейронкой (не трогать руками)
  • CLAUDE.md — схема/мозг системы: инструкции для LLM (аналог Agents.md)

Автоматически создаются:

  • wiki/index.md — оглавление всех wiki-файлов с краткими описаниями
  • wiki/log.md — хронология обработанных источников (против дублирования)

Три операции

Операция Описание
Ingest Обработка новых файлов из raw/, создание/обновление wiki-страниц
Query Запрос: LLM читает index.md, рекурсивно обходит связанные файлы, даёт ответ с полным контекстом
Lint Периодическая очистка: удаление дублей, добавление недостающих ссылок, расшифровка акронимов

Почему лучше RAG (на малых объёмах)

  • RAG ищет похожие чанки → теряет структурные связи между идеями
  • LLM Wiki сохраняет кросс-ссылки → LLM рекурсивно собирает полный контекст
  • Работает лучше до ~100 источников / несколько сотен wiki-страниц
  • При росте — создавать отдельные Wiki для каждого проекта/топика

Аналогия Карпатого

Obsidian = IDE, LLM = разработчик, wiki-файлы = код

Человек: выбирает источники, задаёт вопросы, корректирует
LLM: создаёт, обновляет и связывает wiki-страницы

Исторический контекст — Мемекс (1945)

Концепция уходит корнями к эссе Ванневара Буша "As We May Think" (1945) — описание электромеханического устройства Memex с ассоциативными ссылками между базами знаний. Проблема того времени — поддержка актуальности базы. AI снимает эту проблему, беря на себя создание и обновление связей.


Практический кейс — Slack-чат команды

Задача: Еженедельно загружать внутреннюю переписку → извлекать инсайты
Что нашла LLM из одной недели чата:

  • Graph RAG и эволюция подходов
  • LLM Gateway / cost control (проблема: маркетинг слил бюджет OpenAI за день через внутренний API)
  • Security AI (взлом внутреннего бота)
  • Агентские workflows с Jira/Slack/Confluence
  • Open Source vs API дискуссии

Пример query: "Что будем делать с контролированием трат на нейронки?"
Ответ LLM: полная проблематика + решение: LLM Gateway → семантический роутинг (простые задачи → локальная Llama, сложные → облако), лимиты по пользователям, блокировка sensitive data.


Настройка системы (шаги)

  1. Установить Obsidian (бесплатно, obsidian.md)
  2. Создать проект → папки raw/ и wiki/
  3. Установить плагин Terminal (Community Plugins) для встроенного терминала
  4. Создать CLAUDE.md со схемой (можно сгенерировать из описания концепта Карпатого)
  5. В CLAUDE.md прописать: ingest workflow, query workflow, lint workflow, формат страниц, правила (rules)
  6. Запустить claude code из директории проекта
  7. Команды: ingest new data, query: <вопрос>, lint

Что применить / главные инсайты

  • Для Obsidian vault: настроить LLM Wiki для накопления инсайтов из статей, видео, заметок — вместо плоского хранения
  • Для Pulse App: потенциально — анализ накопленных данных через wiki-структуру
  • Ключевое: CLAUDE.md / schema — главный файл, который нужно тщательно настраивать и дополнять правилами по мере роста системы
  • Масштабирование: не одна большая wiki, а отдельные wiki per project/domain с изолированными index.md
  • Graph View в Obsidian визуализирует "узлы напряжения" — точки концентрации знаний, на которые стоит обращать внимание
  • LLM Wiki ≠ замена RAG везде, но превосходит его там где важны межконцептуальные связи и богатый контекст

Применимые сценарии (по Карпатому)

  • Личная база знаний (книги, статьи, курсы)
  • Исследовательская работа — трекинг пересечений концептов
  • Бизнес-команда — внутренние чаты, документация, звонки клиентов
  • Конкурентный анализ