View Single Post
Staro 16.06.2007., 23:36   #4
LAcy
Pink Floyd fan
Moj komp
 
LAcy's Avatar
 
Datum registracije: Nov 2001
Lokacija: Santa Clara, CA
Postovi: 5,531
O sine razmetni, dobro došao nazad.

Na žalost moram vrlo kritično komentirati tvoju kolumnu ili možda ne kolumnu koliko pojam upravljanja glasom i prepoznavanja govora kao takvog. Mišljenja sam da se ta dva pojma ne mogu poistovjetiti, iako ih ne poistovjećuješ samo ti.

Da bi upravljanje glasom bilo moguće potrebno je prije svega razviti umjetnu inteligenciju koja će, slično čovjeku, moći razumjeti sadržaj izgovorenih riječi i prema njima izvršiti radnju. Nadam se da je svima jasno da čovjek vrlo rijetko doista čuje sve što mu se govori, već na osnovu dosadašnjeg iskustva, inteligencije i vrlo brze obrade u realnom vremenu zaključuje sadržaj. Ovakvo računalo se predstavlja u SF-ovima, računalo koje ne prepoznaje samo govor već se sa njim razgovara! Ono bi razmjelo: prekopiraj mi sve doc fajlove u novi folder koji se zove wordovi dokumenti. To bi već imalo smisla, za razliku od ovoga danas, koje besmisleno pokušava zamijeniti klikanje pojedinom glasovnom naredbom.

Da bih malo ilustrirao što želim reći. Svi ste vjerojatno bili u vrlo bučnoj sredini, ili manje bučnoj ali u svakom slučaju ne idealnim uvjetima. I za divno čudo ste mogli razgovarati sa određenom osobom. Kako? Upravo iz onih razloga što sam naveo, malo ste čitali sa usana, malo ste dodatnim procesiranjem u mozgu izdvajali upravo njegovu boju glasa (mozgom, ne ušima), a većinom ste zaključivali iz konteksta. Druga ilustracije je strani jezik, ako ga ne znate dobro vrlo je bitno točno čuti svaku riječ. Ako se pak radi o vlastitom jeziku i još poznate osobe, može mrmljati a da ipak sve razumijete osim novih i vama nepoznatih riječi. Sjećam se iz srednje škole na hrvatskom se govorilo o pogreškama prilikom verbalne komunikacije i načinu na koji zapravo razgovaramo.

Već sam krsoitio oavj prmijer, kjoi daokuzje da čvoejk ne prpeozanje solvo po sovlo čak ni kad čtia, već ikusstevno zna perponzati riečji i smao letičminim poelgdom zna što je npaaisno untaoč iprejsmešatnim solvmia. Sve dok ne naiđe na nepoznatu riječ. Slično je i sa slušanjem govora.

Prepoznavanje govora, bi pak bila tehnika koja će prepoznati samo što govornik govori, bez potrebe za razumijevanjem sadržaja. Primjena iste bi bila recimo u diktiranju nekakvog teksta.

Mozak je vrlo, vrlo brz paraleliziran procesor.

Nadam se da sam bio dovoljno jasan i relativno kratak
__________________




Gigabyte Z170MX-Gaming 5 LGA1151
Core i7-6700K LGA1151 Skylake
Thermalright Le Grand Macho RT
Patriot Viper 4 Series DDR4 64GB (4 x 16GB) 3200MHz
RTX 2080 TI 11GB GDDR6
Samsung 850 EVO M.2 1TB SSD
Samsung 32" (2560x1440) CHG70 Gaming Monitor with Quantum Dot
MacBook M1 Pro
MacBook Air M2
Moto Edge





LAcy je offline   Reply With Quote