Prepoznava govora je zaradi motenj vse pomembnejša. Prenosni telefon usmerja pozornost na zaslon. Avtomobilski proizvajalci si zato prizadevajo ponuditi čim več zgolj z glasom. Foto: MMC RTV SLO/Avtomobilnost
Prepoznava govora je zaradi motenj vse pomembnejša. Prenosni telefon usmerja pozornost na zaslon. Avtomobilski proizvajalci si zato prizadevajo ponuditi čim več zgolj z glasom. Foto: MMC RTV SLO/Avtomobilnost

Ne samo, da komunikacija med ljudmi postaja vedno zahtevnejša in bolj zapletena, tudi komunikacijo med človekom in strojem smo v zadnjem času dodobra zapletli.

Več orodij, tehnologij, sistemov komuniciranja še ne pomeni, da se bomo lažje, hitreje in bolje razumeli. Nova tehnologija v veliko primerih ne pomeni najboljše rešitve. Danes lahko avtomobile upravljamo z glasom, lahko mahamo levo in desno, prevrtavamo s prstom naprej in nazaj, lahko drsamo z vmesnikom po površini, kjer je bila včasih prestavna ročica, lahko s prstom drsamo po zaslonu na dotik, ali pa se igramo s tipkami na volanu.

Je glasovno upravljanje varnejše?

Oči ostanejo na cesti

Med vsemi naštetimi ima prav posebno mesto govorno upravljanje. Že res, da med govorom misli odidejo drugam, ampak vsaj oči še vedno ostanejo na cesti. Prav zato ima ta pot komuniciranja z avtomobilom še velik potencial. In tudi nekaj težav, oziroma izzivov. Že jezikovna ovira ni preprosta. Na svetu imamo med 6.000 in 7.000 jeziki. Samo v Evropi, in tu ne štejemo narečij, imamo okoli 225 avtohtonih jezikov.

V Avtomobilnosti smo se poskušali ena na ena pogovarjati z avtomobilom.

Da dobimo slovenska navodila, je nujno, da bi vsi avtomobili imeli slovenske menije, to bi bilo treba uzakoniti. Še vedno pa bomo v zaostanku, če ne bomo dobili sistemov, ki nam bodo omogočali, da bomo govorili slovensko. Tega za zdaj še ni. Foto: MMC RTV SLO/Avtomobilnost
Da dobimo slovenska navodila, je nujno, da bi vsi avtomobili imeli slovenske menije, to bi bilo treba uzakoniti. Še vedno pa bomo v zaostanku, če ne bomo dobili sistemov, ki nam bodo omogočali, da bomo govorili slovensko. Tega za zdaj še ni. Foto: MMC RTV SLO/Avtomobilnost

In v redakciji Avtomobilnosti smo želeli biti realni, zato smo poskušali poiskati najmanjše zlo. To nikakor niso zasloni na dotik. Pravijo, da je najvarnejše upravljanje z glasom. In sam bi se kar strinjal, to je tudi moj najljubši način upravljanja. Z glasom kličem, pošiljam sporočila, predvajam glasbo ali pa podcaste. Z glasovnim upravljanjem si lahko delam zapiske.

Velik napredek pri prepoznavi stavkov

Zakaj je takšen način upravljanja avta boljši kot vsi drugi? Vodja razvoja glasovnega upravljanja pri Audiju Gerd Gruchalski je za Avtomobilnost pojasnil: "Prvi Audijevi sistemi so prepoznali le sto ali dvesto stavkov. Današnji sistem vsebuje nekaj čez 60.000 stavkov. Z dodanimi besedami, različicami, sopomenkami in statističnimi podatki lahko voznik teoretično uporabi na milijone besednih zvez."

Glasovno upravljanje vozila je danes bistveno drugačno kot takrat, ko se je začelo uveljavljati. Takrat sem recimo lahko samo poklical določeno osebo oziroma sem moral poznati točno določene besede oziroma izraze, ki jih je avto poznal, da je bil ukaz izveden. Danes pa lahko rečemo tudi hvala in dobimo odgovor: "Ni za kaj". Z avtom se lahko torej pogovarjamo. "Zdajšnji sistem ni odvisen od govorca. Prepoznava celo nekaj slenga in narečij, visok, nizek glas, počasen in hiter govor. Učenje ni potrebno," pravi sogovornik iz Audija.

Glas je najprimernejši za upravljanje funkcij med vožnjo, med postanki bodo še vedno koristni veliki zasloni kot pri Tesli, za igranje video igric ali ogled filma. Foto: MMC RTV SLO/Avtomobilnost
Glas je najprimernejši za upravljanje funkcij med vožnjo, med postanki bodo še vedno koristni veliki zasloni kot pri Tesli, za igranje video igric ali ogled filma. Foto: MMC RTV SLO/Avtomobilnost

Apple in Google v veliki prednosti

Še nedavno sem menil, da avtomobili ne bodo nikoli imeli tako dobrih sistemov kot recimo Apple in Google, predvsem zato, ker me prepoznata tudi, če zamenjamo avto. Avte pa po službeni dolžnosti menjam iz dneva v dan. Naši telefoni so našega glasu navajeni. Moje mišljenje je zastarelo, aktualni razlogi so popolnoma drugje. Kajti pri glasovnem upravljanju je bistvena statistika.

Bi se lahko avtomobilisti kakor koli dokopali do tega znanja?
Gruchalski pojasni: "Apple in Google v enem dnevu zbereta več glasovnih podatkov kot vsi znanstveniki v 40 letih, med letoma 1960 in 2000. Na milijone prenosnih telefonov zazna na milijone stavkov. To je poslovno jedro obeh podjetij in nam ni na voljo. Mi uporabljamo sistem Cerence podjetja Nuance, ki ima prav tako dolgoletne izkušnje in velike podatkovne baze. Svoje podatke ponuja kupcem, kot smo mi."

Ne samo, da komunikacija med ljudmi postaja vedno zahtevnejša in bolj zapletena, tudi komunikacijo med človekom in strojem smo v zadnjem času dodobra zakomplicirali. Foto: MMC RTV SLO/Avtomobilnost
Ne samo, da komunikacija med ljudmi postaja vedno zahtevnejša in bolj zapletena, tudi komunikacijo med človekom in strojem smo v zadnjem času dodobra zakomplicirali. Foto: MMC RTV SLO/Avtomobilnost

V prednosti tisti, ki prvi posodobi sistem

Naše pogovore torej lahko kupijo, ne pri najboljših, ampak ali je tekma res odvisna od tega, kdo bo kupil boljšo bazo?
"Tehnologija v vseh avtomobilih je bolj ali manj enaka. Velikih razlik ni, saj je trg prepoznave govora majhen, zlasti tisti del, ki je povezan z avtomobili. Tehnična podlaga pri Mercedesu, BMW-ju, Audiju in Volkswagnu je precej enotna. Gre predvsem za to, kdo prvi posodobi sistem. Ta ima najnovejšega. Toda prepoznavanje danes zaradi giga- in terabajtov podatkov ni več ovira. Vprašanje je, kaj s prepoznavo narediti. Danes nas zanima asistenca. Kako čim bolj pomagati vozniku pri vsakdanjih potrebah," pravi Gruchalski in zaključuje: "Ker je sistem z zaslonom na dotik vse zmogljivejši, zaradi varnosti ne sme ponuditi vsega, kar zmore. Med vožnjo so nekatere možnosti onemogočene. Prepoznava govora je zaradi motenj vse pomembnejša. Prenosni telefon usmerja pozornost na zaslon. Mi si prizadevamo ponuditi čim več zgolj z glasom. Kratek pogled na zaslon za izbiro številke je dovoljen. Toda to traja le sekundo ali dve. Več ni dobro. Med govorom pa še vedno vidimo cesto."

Še podrobneje o prepoznavanju glasu pa v videoprispevku iz oddaje Avtomobilnost.