Files
obsidian/Медиа/YouTube/lichnaya-wiki-na-baze-llm-karpathy.md

100 lines
7.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# Личная Wiki на базе LLM — практические кейсы по Карпатому
**Дата:** 2026-04-29
**Источник:** [YouTube](https://www.youtube.com/watch?v=2ZHHzfMSeWc)
**Теги:** #llm #wiki #rag #ai
---
## Резюме
Видео разбирает практическое применение концепции LLM Wiki от Андрея Карпатого — альтернативы классическому RAG-подходу. В отличие от RAG, где документы делятся на чанки и ищутся по векторному сходству, LLM Wiki сохраняет полный контекст через связанные текстовые файлы с кросс-референсами. Система строится в Obsidian с Claude Code и состоит из трёх каталогов: сырых данных, wiki-файлов и схемы инструкций. Автор демонстрирует реальный кейс на примере анализа рабочего Slack-чата команды.
---
## Ключевые концепции
### Архитектура LLM Wiki
Три каталога:
- **`raw/`** — сырые входящие данные (PDF, Word, txt, чаты)
- **`wiki/`** — текстовые Markdown-файлы, генерируемые нейронкой (не трогать руками)
- **`CLAUDE.md`** — схема/мозг системы: инструкции для LLM (аналог Agents.md)
Автоматически создаются:
- **`wiki/index.md`** — оглавление всех wiki-файлов с краткими описаниями
- **`wiki/log.md`** — хронология обработанных источников (против дублирования)
### Три операции
| Операция | Описание |
|----------|----------|
| **Ingest** | Обработка новых файлов из `raw/`, создание/обновление wiki-страниц |
| **Query** | Запрос: LLM читает `index.md`, рекурсивно обходит связанные файлы, даёт ответ с полным контекстом |
| **Lint** | Периодическая очистка: удаление дублей, добавление недостающих ссылок, расшифровка акронимов |
### Почему лучше RAG (на малых объёмах)
- RAG ищет похожие чанки → теряет структурные связи между идеями
- LLM Wiki сохраняет кросс-ссылки → LLM рекурсивно собирает **полный контекст**
- Работает лучше до ~100 источников / несколько сотен wiki-страниц
- При росте — создавать отдельные Wiki для каждого проекта/топика
### Аналогия Карпатого
> Obsidian = IDE, LLM = разработчик, wiki-файлы = код
Человек: выбирает источники, задаёт вопросы, корректирует
LLM: создаёт, обновляет и связывает wiki-страницы
### Исторический контекст — Мемекс (1945)
Концепция уходит корнями к эссе Ванневара Буша **"As We May Think"** (1945) — описание электромеханического устройства Memex с ассоциативными ссылками между базами знаний. Проблема того времени — поддержка актуальности базы. AI снимает эту проблему, беря на себя создание и обновление связей.
---
## Практический кейс — Slack-чат команды
**Задача:** Еженедельно загружать внутреннюю переписку → извлекать инсайты
**Что нашла LLM из одной недели чата:**
- Graph RAG и эволюция подходов
- LLM Gateway / cost control (проблема: маркетинг слил бюджет OpenAI за день через внутренний API)
- Security AI (взлом внутреннего бота)
- Агентские workflows с Jira/Slack/Confluence
- Open Source vs API дискуссии
**Пример query:** "Что будем делать с контролированием трат на нейронки?"
**Ответ LLM:** полная проблематика + решение: LLM Gateway → семантический роутинг (простые задачи → локальная Llama, сложные → облако), лимиты по пользователям, блокировка sensitive data.
---
## Настройка системы (шаги)
1. Установить **Obsidian** (бесплатно, obsidian.md)
2. Создать проект → папки `raw/` и `wiki/`
3. Установить плагин **Terminal** (Community Plugins) для встроенного терминала
4. Создать `CLAUDE.md` со схемой (можно сгенерировать из описания концепта Карпатого)
5. В `CLAUDE.md` прописать: ingest workflow, query workflow, lint workflow, формат страниц, правила (rules)
6. Запустить `claude code` из директории проекта
7. Команды: `ingest new data`, `query: <вопрос>`, `lint`
---
## Что применить / главные инсайты
- **Для Obsidian vault:** настроить LLM Wiki для накопления инсайтов из статей, видео, заметок — вместо плоского хранения
- **Для Pulse App:** потенциально — анализ накопленных данных через wiki-структуру
- **Ключевое:** CLAUDE.md / schema — главный файл, который нужно тщательно настраивать и дополнять правилами по мере роста системы
- **Масштабирование:** не одна большая wiki, а отдельные wiki per project/domain с изолированными index.md
- **Graph View в Obsidian** визуализирует "узлы напряжения" — точки концентрации знаний, на которые стоит обращать внимание
- LLM Wiki ≠ замена RAG везде, но превосходит его там где важны **межконцептуальные связи** и **богатый контекст**
---
## Применимые сценарии (по Карпатому)
- Личная база знаний (книги, статьи, курсы)
- Исследовательская работа — трекинг пересечений концептов
- Бизнес-команда — внутренние чаты, документация, звонки клиентов
- Конкурентный анализ