Ima dobrih TTS modela koji pričaju naški, ima čak i STT modela koji transcribaju naški... to je sve drugi korak kad riješim engleski
Znači chatgpt je složio Python skriptu koja:
1. sluša na lokalnom kompu s mikrofonom
2. recorda 5 sekundi kad čuje govor
3. šalje serveru na transcribe
4. dobiva tekst natrag
5. šalje dobiveni tekst LLM-u na server
6. LLM šalje odgovor natrag
7. python skripta šalje dobiveni tekst Coqui TTS na server
8. CoquiTTS šalje wav natrag na playback
9. skripta pušta snimljeni wav file
I što je najgore ovo je upravo proradilo nakon što se cijelo jutro zezam s ovim.
I komplicirano je do ibera, da. Mora biti neki bolji način.