3
fotot
IMERAKENDUS: Juba on asjad niikaugel, et programm, mis etteloetu ise tekstiks muudab – pealegi eesti keeles –, on vähemalt Androidi nutitelefonide jaoks täiesti olemas. ()

"Esimesed katsetused lähevad kindlasti aia taha, sest rääkima peab loomulikult, kuid õige valjuse ja kiirusega. Sõna lõpud tuleks korralikult välja hääldada. Umbes kuuendal korral peaks juba väga hästi välja tulema," hindab Tanel Alumäe TTÜ Küberneetika Instituudi foneetika ja kõnetehnoloogia laborist praegust seisu eestikeelse jutu nutitelefoni abil arvutiekraanilt loetavaks tekstiks muutmisel.

Võistluse "Keeletegu 2011" võitsid infotehnoloogia- ja keeleteadlased Tanel Alumäe ja Kaarel Kaljurand Androidi nutitelefoniplatvormile loodud kõnetuvastustehnoloogial põhineva kolme rakenduse eest. Androidi veebipoest tasuta telefoni tõmmatavad rakendused "Kõnele", "Arvutaja" ja "Diktofon" valmisid TTÜ Küberneetika Instituudi foneetika ja kõnetehnoloogia laboris. Kuid, nagu nüüdisaegses maailmas kombeks, teeb Alumäe igapäevatööd Tallinnas ja Kaljurand hoopis Belgias. Mõlemad kinnitavad, et nende töö puhul pole mingit sisulist vahet, kas kolleeg istub iga päev kõrvalkabinetis või tegutseb teises riigis.

Kaljurand kinnitab, et töö oli neil väga täpselt jaotatud. "Tanel tegi serveri poolt, mina nutitelefoni rakendusi, nii et me teineteisele väga varba peale astuda ei oleks saanudki. Pidime lihtsalt kokku leppima, millised on liidesed, mille kaudu nutitelefon serveriga suhtleb."

Rakendused sündisid aastaga

Kauaaegse tuttavaga on tema sõnul ka kaugtööd hõlpsam koos teha kui võhivõõraga, ehkki paljude sääraste vaba lähtekoodiga projektide puhul olevatki programmeerijad maailma laiali paisatud ja suhtlevad omavahel ainult skaipides, tšättides või e-kirja teel.

Androidi rakendustega ja neid toetava serveriga alustati tööd 2011. aasta algul ning rakendused jõudsid kasutajateni juba aasta lõpul. "Ega me muidugi sajaprotsendiliselt ainult nendega hõivatud ei olnud, teiste töödega tuli ka tegelda. Androidi rakendused on nii-öelda kõigest koorik tuumiktehnoloogia peal. Nende kättesaadavus kasutajale on samas väga tähtis ja sellepärast me seda tegimegi, et laiem publik saaks osa tehnoloogiast, mis varem oli olemas vaid labori arvutites," lausub Alumäe.

Tasuta allalaetavaid rakendusi võivad elektroonikafirmad või programmeerijad omakorda kasutada uute rakenduste loomiseks. "Idee järgi ei peakski meiesugused programmeerijad lõppkasutajatele mõeldud toodetega tegelema. Kuid andsime endale aru, et meie ise tunneme oma tehnoloogiat kõige paremini ja niisuguse asja valmistamine võib mõnele firmale mitte jõukohane olla. Nii otsustasime rakendused seekord prototüübi tasemel ise teha. Kui keegi tahab neid edasi arendada, teeb see meile vaid suurt rõõmu," põhjendab Alumäe, miks nemad kui teadlased sellise asja ette võtsid.

Näiteks võiksid elektroonikafirmad tema arvates võtta olemasoleva Androidi rakenduse, kus on Tallinna ühissõidukite sõiduplaanid ja peatuste nimed. Praegu tuleb rakenduses olevasse kastikesse kirjutada peatuse nimi. "Sinna kõrvale võiks kuvada mikrofoni nupu ja teha peatuse nime häälega sisestatavaks. See oleks lihtne töö."

Autodesse paigaldatavate navigatsiooniseadmete tootjad välismaal ilmselt eestikeelse kõnetuvastustehnoloogia arendamisega tegelema ei hakka. Nii Alumäe kui ka Kaljurand näevad siin samuti võimalust omaloodud rakenduste kasutamiseks.

Isegi maja hakkab kunagi jutust aru saama

Häälrakenduste edasiarendused teeksid kindlasti oluliselt lihtsamaks inimeste elu, kellel on mingi füüsiline puue ja klaviatuuri kasutamine sellepärast raske või võimatu. Siin võiks vaadata juba mobiilirakendustest kaugemale. Näiteks on suuremates keelkondades olemas võimalus telerist uudiseid või saateid vaadates lülitada sisse automaatse kõnetuvastuse abil genereeritud subtiitrid, ehkki filmide puhul need päris hästi veel ei tööta. Teadlased on seisukohal, et puuetega inimestele mõeldud kõnetuvastuse rakendusi peaksid välja töötama ja arendama siiski erakapitalil põhinevad firmad.

Kaljuranna kinnitusel võiks üks valdkond olla ka tervetele inimestele mõeldud "tark maja", kus vastavate häälkäskudega saaks näiteks valgusteid sisse lülitada või kardinaid akende ette tõmmata. "Kindlasti oleks see kasutajasõbralikum kui juhtimispuldid."

Spontaanse kõnega on arvutil raskusi

Ajakirjanikke ja teisi kõnesalvestustega töötavaid inimesi huvitab loomulikult, millal jõuab kõnetuvastustehnoloogia diktofonidesse – nii et salvestatud jutt kohe masina poolt üleskirjutatuna ekraanile ilmuks. Selliste rakendusteni jõudmiseks kulub siiski veel aega: spontaanse kõne äratundmine on arvutile palju keerulisem kui dikteeritud kõne tuvastamine. Hääldus on korrapäratu, sõnade lõpud neelatakse alla ja palju esineb kõhklushäälitsusi. Kõnetuvastusmudeleid treenitakse niinimetatud kõnekorpuste põhjal, mis oma olemuselt on andmebaasid, kuhu on salvestatud paljude inimeste öeldud palju lauseid, aga spontaanset kõnet ei sisalda need korpused esialgu küll kuigi palju, tähendab Alumäe.

Üks auhinnatud rakendustest – "Diktofon" –, ongi selleks loodud, et sinna saaks teha pikki kõnesalvestusi ja lõpetades vajutada ekraanil nuppu, mis saadab salvestise töötlemiseks Küberneetika Instituudi serverisse. "Tasub ainult teada, et teksti lahtiragistamine võtab süsteemil aega kuus korda kauem, kui on salvestuse pikkus. Tunniajase salvestuse puhul seega kuus tundi. Seejärel saadetakse see kasutajale tagasi ja esitatakse talle nõnda, et ta näeb ekraanilt teksti ja saab seda samal ajal kuulata," seletab Alumäe.

Veidi tulevikku vaadates ei pea kumbki teadlane siiski võimatuks, et tehnoloogiat edasi arendades suudavad masinad kunagi edastama hakata näiteks koosolekute protokolle. Selline automaatne sekretär võiks asendada inimest. Kõik need tehnoloogiad on tänapäeval juba olemas, kuid ei tööta teadlaste sõnul veel kuigi hästi.

Jaga artiklit

0 kommentaari

Päevatoimetaja

Marge Sillaots
Telefon 51993733
marge.sillaots@ohtuleht.ee

Õhtuleht sotsiaalmeedias

Õhtuleht Mobiilis