home-voice-assistant/remove_silent.py

import wave
from pathlib import Path
import numpy as np

for sub, t in [('positive', 250), ('negative', 200)]:
    d = Path(f'training/own_samples/cosmo/{sub}')
    removed = 0
    for f in sorted(d.glob('*.wav')):
        with wave.open(str(f)) as w:
            data = np.frombuffer(w.readframes(w.getnframes()), dtype=np.int16)
        if np.sqrt(np.mean(data.astype(np.float64)**2)) < t:
            f.unlink(); removed += 1

    files = sorted(d.glob('*.wav'))
    for i, f in enumerate(files, 1):
        f.rename(d / f'_tmp_{i:03d}.wav')
    for i, f in enumerate(sorted(d.glob('_tmp_*.wav')), 1):
        f.rename(d / f'{i:03d}.wav')

    print(f'{sub}: removed {removed}, renumbered → 001..{len(files):03d}.wav')