diff --git a/Медиа/YouTube/lichnaya-wiki-na-baze-llm-karpathy.md b/Медиа/YouTube/lichnaya-wiki-na-baze-llm-karpathy.md new file mode 100644 index 0000000..53100f6 --- /dev/null +++ b/Медиа/YouTube/lichnaya-wiki-na-baze-llm-karpathy.md @@ -0,0 +1,99 @@ +# Личная Wiki на базе LLM — практические кейсы по Карпатому + +**Дата:** 2026-04-29 +**Источник:** [YouTube](https://www.youtube.com/watch?v=2ZHHzfMSeWc) +**Теги:** #llm #wiki #rag #ai + +--- + +## Резюме + +Видео разбирает практическое применение концепции LLM Wiki от Андрея Карпатого — альтернативы классическому RAG-подходу. В отличие от RAG, где документы делятся на чанки и ищутся по векторному сходству, LLM Wiki сохраняет полный контекст через связанные текстовые файлы с кросс-референсами. Система строится в Obsidian с Claude Code и состоит из трёх каталогов: сырых данных, wiki-файлов и схемы инструкций. Автор демонстрирует реальный кейс на примере анализа рабочего Slack-чата команды. + +--- + +## Ключевые концепции + +### Архитектура LLM Wiki + +Три каталога: +- **`raw/`** — сырые входящие данные (PDF, Word, txt, чаты) +- **`wiki/`** — текстовые Markdown-файлы, генерируемые нейронкой (не трогать руками) +- **`CLAUDE.md`** — схема/мозг системы: инструкции для LLM (аналог Agents.md) + +Автоматически создаются: +- **`wiki/index.md`** — оглавление всех wiki-файлов с краткими описаниями +- **`wiki/log.md`** — хронология обработанных источников (против дублирования) + +### Три операции + +| Операция | Описание | +|----------|----------| +| **Ingest** | Обработка новых файлов из `raw/`, создание/обновление wiki-страниц | +| **Query** | Запрос: LLM читает `index.md`, рекурсивно обходит связанные файлы, даёт ответ с полным контекстом | +| **Lint** | Периодическая очистка: удаление дублей, добавление недостающих ссылок, расшифровка акронимов | + +### Почему лучше RAG (на малых объёмах) + +- RAG ищет похожие чанки → теряет структурные связи между идеями +- LLM Wiki сохраняет кросс-ссылки → LLM рекурсивно собирает **полный контекст** +- Работает лучше до ~100 источников / несколько сотен wiki-страниц +- При росте — создавать отдельные Wiki для каждого проекта/топика + +### Аналогия Карпатого + +> Obsidian = IDE, LLM = разработчик, wiki-файлы = код + +Человек: выбирает источники, задаёт вопросы, корректирует +LLM: создаёт, обновляет и связывает wiki-страницы + +### Исторический контекст — Мемекс (1945) + +Концепция уходит корнями к эссе Ванневара Буша **"As We May Think"** (1945) — описание электромеханического устройства Memex с ассоциативными ссылками между базами знаний. Проблема того времени — поддержка актуальности базы. AI снимает эту проблему, беря на себя создание и обновление связей. + +--- + +## Практический кейс — Slack-чат команды + +**Задача:** Еженедельно загружать внутреннюю переписку → извлекать инсайты +**Что нашла LLM из одной недели чата:** +- Graph RAG и эволюция подходов +- LLM Gateway / cost control (проблема: маркетинг слил бюджет OpenAI за день через внутренний API) +- Security AI (взлом внутреннего бота) +- Агентские workflows с Jira/Slack/Confluence +- Open Source vs API дискуссии + +**Пример query:** "Что будем делать с контролированием трат на нейронки?" +**Ответ LLM:** полная проблематика + решение: LLM Gateway → семантический роутинг (простые задачи → локальная Llama, сложные → облако), лимиты по пользователям, блокировка sensitive data. + +--- + +## Настройка системы (шаги) + +1. Установить **Obsidian** (бесплатно, obsidian.md) +2. Создать проект → папки `raw/` и `wiki/` +3. Установить плагин **Terminal** (Community Plugins) для встроенного терминала +4. Создать `CLAUDE.md` со схемой (можно сгенерировать из описания концепта Карпатого) +5. В `CLAUDE.md` прописать: ingest workflow, query workflow, lint workflow, формат страниц, правила (rules) +6. Запустить `claude code` из директории проекта +7. Команды: `ingest new data`, `query: <вопрос>`, `lint` + +--- + +## Что применить / главные инсайты + +- **Для Obsidian vault:** настроить LLM Wiki для накопления инсайтов из статей, видео, заметок — вместо плоского хранения +- **Для Pulse App:** потенциально — анализ накопленных данных через wiki-структуру +- **Ключевое:** CLAUDE.md / schema — главный файл, который нужно тщательно настраивать и дополнять правилами по мере роста системы +- **Масштабирование:** не одна большая wiki, а отдельные wiki per project/domain с изолированными index.md +- **Graph View в Obsidian** визуализирует "узлы напряжения" — точки концентрации знаний, на которые стоит обращать внимание +- LLM Wiki ≠ замена RAG везде, но превосходит его там где важны **межконцептуальные связи** и **богатый контекст** + +--- + +## Применимые сценарии (по Карпатому) + +- Личная база знаний (книги, статьи, курсы) +- Исследовательская работа — трекинг пересечений концептов +- Бизнес-команда — внутренние чаты, документация, звонки клиентов +- Конкурентный анализ