Initial commit: Cosmo voice assistant

Полностью локальный голосовой ассистент на Python.

Стек:
- Wake word: openWakeWord (onnxruntime)
- STT: RealtimeSTT + faster-whisper + Silero VAD (CUDA)
- LLM-агент: smolagents ToolCallingAgent + Ollama qwen2.5:7b
- TTS: Silero V4 (torch.hub) + sounddevice
- Shell: Git Bash (Windows) / bash (macOS)

Поддерживает Windows и macOS. Агент с памятью и tool calling —
находит программы самостоятельно, запоминает пути, выполняет
произвольные shell-команды.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
d.klimov
2026-04-10 15:58:12 +03:00
commit 6010816f1d
23 changed files with 1969 additions and 0 deletions

21
requirements.txt Normal file
View File

@@ -0,0 +1,21 @@
# Wake word
openwakeword==0.6.0
# STT — стриминг с Silero VAD
RealtimeSTT==0.3.104
# TTS — Silero V4 для русского языка
RealtimeTTS==0.6.1
torch>=2.0.0 # нужен для Silero (CPU inference)
# Agent framework
smolagents==1.11.0
ollama==0.4.4 # официальный Python клиент Ollama
# Память и конфиг
pyyaml==6.0.2
loguru==0.7.2
# Инструменты агента
psutil==6.0.0
pyautogui==0.9.54