📺 Личная Wiki на базе LLM — кейсы по Карпатому
This commit is contained in:
99
Медиа/YouTube/lichnaya-wiki-na-baze-llm-karpathy.md
Normal file
99
Медиа/YouTube/lichnaya-wiki-na-baze-llm-karpathy.md
Normal file
@@ -0,0 +1,99 @@
|
|||||||
|
# Личная Wiki на базе LLM — практические кейсы по Карпатому
|
||||||
|
|
||||||
|
**Дата:** 2026-04-29
|
||||||
|
**Источник:** [YouTube](https://www.youtube.com/watch?v=2ZHHzfMSeWc)
|
||||||
|
**Теги:** #llm #wiki #rag #ai
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Резюме
|
||||||
|
|
||||||
|
Видео разбирает практическое применение концепции LLM Wiki от Андрея Карпатого — альтернативы классическому RAG-подходу. В отличие от RAG, где документы делятся на чанки и ищутся по векторному сходству, LLM Wiki сохраняет полный контекст через связанные текстовые файлы с кросс-референсами. Система строится в Obsidian с Claude Code и состоит из трёх каталогов: сырых данных, wiki-файлов и схемы инструкций. Автор демонстрирует реальный кейс на примере анализа рабочего Slack-чата команды.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Ключевые концепции
|
||||||
|
|
||||||
|
### Архитектура LLM Wiki
|
||||||
|
|
||||||
|
Три каталога:
|
||||||
|
- **`raw/`** — сырые входящие данные (PDF, Word, txt, чаты)
|
||||||
|
- **`wiki/`** — текстовые Markdown-файлы, генерируемые нейронкой (не трогать руками)
|
||||||
|
- **`CLAUDE.md`** — схема/мозг системы: инструкции для LLM (аналог Agents.md)
|
||||||
|
|
||||||
|
Автоматически создаются:
|
||||||
|
- **`wiki/index.md`** — оглавление всех wiki-файлов с краткими описаниями
|
||||||
|
- **`wiki/log.md`** — хронология обработанных источников (против дублирования)
|
||||||
|
|
||||||
|
### Три операции
|
||||||
|
|
||||||
|
| Операция | Описание |
|
||||||
|
|----------|----------|
|
||||||
|
| **Ingest** | Обработка новых файлов из `raw/`, создание/обновление wiki-страниц |
|
||||||
|
| **Query** | Запрос: LLM читает `index.md`, рекурсивно обходит связанные файлы, даёт ответ с полным контекстом |
|
||||||
|
| **Lint** | Периодическая очистка: удаление дублей, добавление недостающих ссылок, расшифровка акронимов |
|
||||||
|
|
||||||
|
### Почему лучше RAG (на малых объёмах)
|
||||||
|
|
||||||
|
- RAG ищет похожие чанки → теряет структурные связи между идеями
|
||||||
|
- LLM Wiki сохраняет кросс-ссылки → LLM рекурсивно собирает **полный контекст**
|
||||||
|
- Работает лучше до ~100 источников / несколько сотен wiki-страниц
|
||||||
|
- При росте — создавать отдельные Wiki для каждого проекта/топика
|
||||||
|
|
||||||
|
### Аналогия Карпатого
|
||||||
|
|
||||||
|
> Obsidian = IDE, LLM = разработчик, wiki-файлы = код
|
||||||
|
|
||||||
|
Человек: выбирает источники, задаёт вопросы, корректирует
|
||||||
|
LLM: создаёт, обновляет и связывает wiki-страницы
|
||||||
|
|
||||||
|
### Исторический контекст — Мемекс (1945)
|
||||||
|
|
||||||
|
Концепция уходит корнями к эссе Ванневара Буша **"As We May Think"** (1945) — описание электромеханического устройства Memex с ассоциативными ссылками между базами знаний. Проблема того времени — поддержка актуальности базы. AI снимает эту проблему, беря на себя создание и обновление связей.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Практический кейс — Slack-чат команды
|
||||||
|
|
||||||
|
**Задача:** Еженедельно загружать внутреннюю переписку → извлекать инсайты
|
||||||
|
**Что нашла LLM из одной недели чата:**
|
||||||
|
- Graph RAG и эволюция подходов
|
||||||
|
- LLM Gateway / cost control (проблема: маркетинг слил бюджет OpenAI за день через внутренний API)
|
||||||
|
- Security AI (взлом внутреннего бота)
|
||||||
|
- Агентские workflows с Jira/Slack/Confluence
|
||||||
|
- Open Source vs API дискуссии
|
||||||
|
|
||||||
|
**Пример query:** "Что будем делать с контролированием трат на нейронки?"
|
||||||
|
**Ответ LLM:** полная проблематика + решение: LLM Gateway → семантический роутинг (простые задачи → локальная Llama, сложные → облако), лимиты по пользователям, блокировка sensitive data.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Настройка системы (шаги)
|
||||||
|
|
||||||
|
1. Установить **Obsidian** (бесплатно, obsidian.md)
|
||||||
|
2. Создать проект → папки `raw/` и `wiki/`
|
||||||
|
3. Установить плагин **Terminal** (Community Plugins) для встроенного терминала
|
||||||
|
4. Создать `CLAUDE.md` со схемой (можно сгенерировать из описания концепта Карпатого)
|
||||||
|
5. В `CLAUDE.md` прописать: ingest workflow, query workflow, lint workflow, формат страниц, правила (rules)
|
||||||
|
6. Запустить `claude code` из директории проекта
|
||||||
|
7. Команды: `ingest new data`, `query: <вопрос>`, `lint`
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Что применить / главные инсайты
|
||||||
|
|
||||||
|
- **Для Obsidian vault:** настроить LLM Wiki для накопления инсайтов из статей, видео, заметок — вместо плоского хранения
|
||||||
|
- **Для Pulse App:** потенциально — анализ накопленных данных через wiki-структуру
|
||||||
|
- **Ключевое:** CLAUDE.md / schema — главный файл, который нужно тщательно настраивать и дополнять правилами по мере роста системы
|
||||||
|
- **Масштабирование:** не одна большая wiki, а отдельные wiki per project/domain с изолированными index.md
|
||||||
|
- **Graph View в Obsidian** визуализирует "узлы напряжения" — точки концентрации знаний, на которые стоит обращать внимание
|
||||||
|
- LLM Wiki ≠ замена RAG везде, но превосходит его там где важны **межконцептуальные связи** и **богатый контекст**
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Применимые сценарии (по Карпатому)
|
||||||
|
|
||||||
|
- Личная база знаний (книги, статьи, курсы)
|
||||||
|
- Исследовательская работа — трекинг пересечений концептов
|
||||||
|
- Бизнес-команда — внутренние чаты, документация, звонки клиентов
|
||||||
|
- Конкурентный анализ
|
||||||
Reference in New Issue
Block a user