Tako bi trebalo biti, ali ne znam kako to riješiti s Pythonom, lokalno.
Znači chatgpt je složio verziju skripte gdje čeka da stisnem enter, snima 5 sekundi, šalje na transcribe ... i ta verzija radi odlično... stisneš enter, pitaš "how are you" i dobiješ glasovni odgovor "i'm fine thanks for asking"
ali to staviti u loop ne ide nikako jer ako je tišina, u recording uđe šum i transcribe napravi neko nepostojeće pitanje pa dobiješ i nepostojeći odgovor.. probao dizati threshold ali onda uopće ne reagira ili prekasno reagira ili kad krene slušat već sam gotov s pitanjem ili uhvati samo zadnju riječ itd itd.
wake word bi bio idealan, pitanje je kako to napraviti...