O sine razmetni, dobro došao nazad.
Na žalost moram vrlo kritično komentirati tvoju kolumnu ili možda ne kolumnu koliko pojam upravljanja glasom i prepoznavanja govora kao takvog. Mišljenja sam da se ta dva pojma ne mogu poistovjetiti, iako ih ne poistovjećuješ samo ti.
Da bi upravljanje glasom bilo moguće potrebno je prije svega razviti umjetnu inteligenciju koja će, slično čovjeku, moći razumjeti sadržaj izgovorenih riječi i prema njima izvršiti radnju. Nadam se da je svima jasno da čovjek vrlo rijetko doista čuje sve što mu se govori, već na osnovu dosadašnjeg iskustva, inteligencije i vrlo brze obrade u realnom vremenu zaključuje sadržaj. Ovakvo računalo se predstavlja u SF-ovima, računalo koje ne prepoznaje samo govor već se sa njim razgovara! Ono bi razmjelo:
prekopiraj mi sve doc fajlove u novi folder koji se zove wordovi dokumenti. To bi već imalo smisla, za razliku od ovoga danas, koje besmisleno pokušava zamijeniti klikanje pojedinom glasovnom naredbom.
Da bih malo ilustrirao što želim reći. Svi ste vjerojatno bili u vrlo bučnoj sredini, ili manje bučnoj ali u svakom slučaju ne idealnim uvjetima. I za divno čudo ste mogli razgovarati sa određenom osobom. Kako? Upravo iz onih razloga što sam naveo, malo ste čitali sa usana, malo ste dodatnim procesiranjem u mozgu izdvajali upravo njegovu boju glasa (mozgom, ne ušima), a većinom ste zaključivali iz konteksta. Druga ilustracije je strani jezik, ako ga ne znate dobro vrlo je bitno točno čuti svaku riječ. Ako se pak radi o vlastitom jeziku i još poznate osobe, može mrmljati a da ipak sve razumijete osim novih i vama nepoznatih riječi. Sjećam se iz srednje škole na hrvatskom se govorilo o pogreškama prilikom verbalne komunikacije i načinu na koji zapravo razgovaramo.
Već sam krsoitio oavj prmijer, kjoi daokuzje da čvoejk ne prpeozanje solvo po sovlo čak ni kad čtia, već ikusstevno zna perponzati riečji i smao letičminim poelgdom zna što je npaaisno untaoč iprejsmešatnim solvmia. Sve dok ne naiđe na nepoznatu riječ. Slično je i sa slušanjem govora.
Prepoznavanje govora, bi pak bila tehnika koja će prepoznati samo što govornik govori, bez potrebe za razumijevanjem sadržaja. Primjena iste bi bila recimo u diktiranju nekakvog teksta.
Mozak je vrlo, vrlo brz paraleliziran procesor.
Nadam se da sam bio dovoljno jasan i relativno kratak
