home-voice-assistant/satellite/modes.py

import os
import sys

from .config import GATEWAY_URL, AGENT, log
from .audio import record
from .tts import speak, stop_speaking
from .llm import ask_agent_stream, Conversation, is_reset_command

# Персистентные сессии — одна на день для каждого агента
_sessions: dict[str, Conversation] = {}


def _get_session(agent_id: str) -> Conversation:
    """Возвращает текущую сессию, создаёт новую если день сменился"""
    conv = _sessions.get(agent_id)
    if conv is None or conv.is_expired():
        conv = Conversation(agent_id=agent_id)
        _sessions[agent_id] = conv
        print(f"🆕 Новая сессия для {agent_id}")
    return conv


def _handle_reset(text: str, agent_id: str) -> bool:
    """Проверяет команду сброса. Возвращает True если сброс произошёл."""
    if is_reset_command(text):
        _sessions[agent_id] = Conversation(agent_id=agent_id)
        msg = "Начинаю новую сессию."
        print(f"🔄 {msg}")
        speak(msg, agent_id)
        return True
    return False


def _conversation_loop(agent_id: str, agent_name: str = "Cosmo"):
    """Основной цикл диалога — слушает и отвечает пока пользователь говорит.
    Выходит когда в течение MAX_DURATION не было речи."""
    conv = _get_session(agent_id)

    while True:
        text = record()
        if not text:
            print(f"😴 Тишина, жду активации...\n")
            return

        print(f"📝 Ты → {agent_name}: {text}")

        if _handle_reset(text, agent_id):
            conv = _get_session(agent_id)
            continue

        response = ask_agent_stream(text, conv=conv, agent_id=agent_id)
        print(f"🤖 {agent_name}: {response}\n")
        # после ответа — следующая итерация с новым record()
        # record() сам гасит эхо через ECHO_WARMUP


def run_with_enter():
    print("\n🦞 Cosmo Satellite запущен (режим: Enter для активации)")
    print(f"   Gateway : {GATEWAY_URL}")
    print(f"   Агент   : {AGENT}")
    print("\nНажми Enter → говори → получи ответ. Ctrl+C для выхода.\n")

    while True:
        try:
            input("⏎  Нажми Enter и говори...")
            stop_speaking()  # barge-in
            _conversation_loop("cosmo", "Cosmo")

        except KeyboardInterrupt:
            print("\n👋 Выход")
            break
        except Exception as e:
            log.exception("Непредвиденная ошибка в цикле Enter")
            print(f"⚠️  Ошибка: {e} — продолжаю работу...\n")


def run_with_porcupine():
    import numpy as np
    import pyaudio
    from openwakeword.model import Model

    cosmo_model = Model(
        wakeword_models=[os.getenv("WAKE_WORD_COSMO")],
        inference_framework="onnx",
    )
    # TODO: подключить Люсю — раскомментировать когда модель lusya обучена
    # lusya_model = Model(
    #     wakeword_models=[os.getenv("WAKE_WORD_LUSYA")],
    #     inference_framework="onnx",
    # )

    audio = pyaudio.PyAudio()
    # OpenWakeWord ожидает 16 kHz mono PCM 16-bit, фреймы по 1280 семплов (80 мс)
    stream = audio.open(rate=16000, channels=1, format=pyaudio.paInt16,
                        input=True, frames_per_buffer=1280)

    print("✅ Слушаю через OpenWakeWord...")
    print("\nСкажи 'Космо'...\n")
    # print("\nСкажи 'Космо' или 'Люся'...\n")  # TODO: после подключения Люси

    try:
        while True:
            try:
                pcm = stream.read(1280, exception_on_overflow=False)
                pcm = np.frombuffer(pcm, dtype=np.int16)

                cosmo_score = cosmo_model.predict(pcm)["cosmo"]
                if cosmo_score > 0.1:
                    print(f"PREDICTION cosmo: {cosmo_score:.3f}")

                if cosmo_score > 0.5:
                    print("✅ Услышал 'Космо'!")
                    stream.stop_stream()
                    _conversation_loop("cosmo", "Cosmo")
                    cosmo_model.reset()
                    stream.start_stream()
                    continue

                # TODO: Люся — раскомментировать когда модель готова
                # lusya_score = lusya_model.predict(pcm)["lusya"]
                # if lusya_score > 0.1:
                #     print(f"PREDICTION lusya: {lusya_score:.3f}")
                # if lusya_score > 0.5:
                #     print("✅ Услышала 'Люся'!")
                #     stream.stop_stream()
                #     _conversation_loop("lusya", "Люся")
                #     lusya_model.reset()
                #     stream.start_stream()
                #     continue

            except KeyboardInterrupt:
                raise
            except Exception as e:
                log.exception("Непредвиденная ошибка в wake-word цикле")
                print(f"⚠️  Ошибка: {e} — продолжаю слушать...\n")

    except KeyboardInterrupt:
        print("\n👋 Выход")
    finally:
        stream.close()
        audio.terminate()