smart-home-tablet

Author	SHA1	Message	Date
Cosmo	05b300d472	chore(voice): security, cleanup, resilience All checks were successful Deploy / deploy (push) Successful in 1m47s Details Безопасность: - Rate-limit на /api/voice/chat (20/мин per cookie/IP, env VOICE_RATE_LIMIT). Защищает от случайных циклов и утечки PIN. - Усечение user prompt'а до 4000 символов в /api/voice/chat. - Tool-loop защита от циклов: если LLM дважды просит тот же tool с теми же args — прерываем (раньше мог уйти в бесконечный цикл при tool error'ах). Чистка кода: - lib/debug.ts — vlog/vwarn/verror гейтят браузерные логи за NEXT_PUBLIC_VOICE_DEBUG=1 (или localStorage 'voice-debug=1'). Серверные console.log оставлены — полезны в Docker logs. - lib/audio-wav.ts — вынесена дублированная floatToWav из VoiceController. - Удалены orphan компоненты FocusCard.tsx и CountdownCard.tsx (не подключены, отвергнуты по UX-фидбеку). Resilience: - WakeWordDetector: drop-on-busy в onChunk — на медленных устройствах (Android, бюджетный CPU) backlog inference больше не копится. - voice-history fallback на /tmp/voice-history если /data не примонтирован (локальная разработка / нестандартная конфигурация).	2026-04-27 12:44:18 +00:00
Cosmo	fddca5de66	fix(wake-word): cosmo.onnx ждёт окно из 25 embedding'ов, не 16 All checks were successful Deploy / deploy (push) Successful in 1m56s Details Из ORT-ошибки: onnx::Flatten_0 index 1 Got: 16 Expected: 25. Стоковые openWakeWord модели тренируются на окне 16, наша cosmo.onnx — на 25. Меняем EMB_WINDOW. Окно для embedding-буфера тоже подвинули, чтобы хватало для classifier'а.	2026-04-27 10:42:59 +00:00
Cosmo	71124ce565	debug(voice): verbose logging для wake-word pipeline Some checks failed Deploy / deploy (push) Has been cancelled Details	2026-04-27 09:57:56 +00:00
Cosmo	522d36d1a2	feat(voice): wake-word «Космо» в браузере (Шаг 3) All checks were successful Deploy / deploy (push) Successful in 6m33s Details openWakeWord pipeline на onnxruntime-web прямо на планшете. Цепочка: mic (16kHz, AudioWorklet) → melspectrogram.onnx → embedding_model.onnx (sliding 76-frame window, stride 8) → cosmo.onnx → score 0..1. Триггер при score≥0.5 → запускается тот же VAD-flow что и push-to-talk. - public/wake/ — cosmo.onnx (custom-trained на голос Даниила) + melspectrogram.onnx + embedding_model.onnx (~2.9MB вместе). - lib/wake-word.ts — WakeWordDetector class. ort грузится через <script src=/vad/ort.wasm.min.js> на клиенте — обход проблемы next-swc с парсингом import.meta.url в onnxruntime-web .mjs билдах. - VoiceController: тап = активация (нужен для AudioContext user-gesture), далее непрерывное слушание wake-word; на детект → MicVAD флоу. Долгий тап = выкл. Ручной тап остаётся как fallback. После деплоя Python-агент на .103 не нужен — можно архивировать home-voice-assistant. На .103 остаётся только ElevenLabs прокси :8888.	2026-04-27 09:43:53 +00:00

4 Commits