Orodje SENTA. Foto: Spletna stran CJVT
Orodje SENTA. Foto: Spletna stran CJVT

Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT UL) je enota Univerze v Ljubljani, namenjena znanstvenemu raziskovanju, vzpostavljanju in vzdrževanju temeljnih digitalnih jezikovnih virov in jezikovnotehnoloških orodij za sodobni slovenski jezik, ki so praktično uporabni in preko spleta dostopni vsem uporabnikom slovenskega jezika v svetu.

Konec prejšnjega leta je v Zbornični dvorani Univerze v Ljubljani potekala javna predstavitev dejavnosti Centra za jezikovne vire in tehnologije Univerze v Ljubljani. Ekipa centra je predstavila rezultate, ki so plod dolgoletnih prizadevanj in sodelovanj z različnimi partnerji. Večina predstavljenih rezultatov izhaja iz projektov, ki sta jih financirala Ministrstvo za kulturo ter Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost (ARIS).

Eno od orodij je tudi SENTA, ki je bilo izdelano v okviru projekta SLOKIT (Nadgradnja CLARIN.SI: Korpusni informator in besedilni analizator), ki je potekal v letih 2022-2023 in ga je financiralo Ministrstvo za kulturo Republike Slovenije. V projektu sta sodelovala tudi Institut Jožef Stefan kot vodilni partner in Društvo študentov invalidov Slovenije. Vodja projekta je bil dr. Iztok Kosem. Z njim smo govorili o orodju SENTA, pomembnih novostih na ravni uporabniške izkušnje in rešitvah, ki izboljšujejo dostopnost in uporabnost virov za osebe s posebnimi potrebami, ki nastajajo v okviru Centra za jezikovne vire in tehnologije Univerze v Ljubljani.

Na CVJT v zadnjem času večji poudarek dajete tudi dostopnosti, tako na ravni dostopnosti slovarskih informacij kot tudi z izdelavo posameznih orodij. Kako je prišlo do te spremembe in večjega poudarka na dostopnosti?

Na CJVT že od samega začetka delovanja dajemo poudarek na uporabniški prijaznosti in razpoložljivosti naših virov, orodij in baz. Tako so na voljo podatkovne baze Slovarja sopomenk sodobne slovenščine, Kolokacijskega slovarja sodobne slovenščine, Velikega slovensko-madžarskega slovarja, oblikoslovnega leksikona Sloleks in številnih korpusov ter programske kode jezikovnotehnoloških orodij, kot so Vejice, SVALA, List, Stark, SENTA itd.

Smo pa v zadnjem času aktivneje pristopili k izboljšanju dostopnosti za osebe s posebnimi potrebami. Povezali smo se z Društvom študentov invalidov Slovenije in podjetjem Sincular, kjer so nam pomagali pri analizi in nadgradnji obstoječih spletnih strani jezikovnih virov. Aktivnosti so potekale v okviru projekta NAPOJ (Nadgradnja portala jezikovnih virov CJVT), ki ga je financiralo Ministrstvo za kulturo.

Na predstavitvi ste omenjali večjo dostopnost slovarskih informacij: kakšne spremembe ste naredili na tem področju in ali načrtujete tudi v prihodnje večjo dostopnost na tej ravni?

V prvem koraku smo z vidika dostopnosti nadgradili spletna vmesnika Slovarja sopomenk sodobne slovenščine in Kolokacijski slovarja sodobne slovenščine, v nadaljevanju pa bomo podobne nadgradnje opravili tudi na ostalih virih CJVT.

Eno od orodij, ki je nastalo v okviru projekta SLOKIT, je SENTA. Kako je potekala izdelava orodja in kako ste sodelovali s partnerji pri projektu?

Orodje SENTA je bilo izdelano v okviru projekta SLOKIT (Nadgradnja CLARIN.SI: Korpusni informator in besedilni analizator), ki je potekal v letih 2022-2023 in ga je financiralo Ministrstvo za kulturo Republike Slovenije. Projekt sem vodil sam. V projektu sta sodelovala tudi Institut Jožef Stefan kot vodilni partner in Društvo študentov invalidov Slovenije. Infrastrukturno podporo izven projektnega financiranja (gostovanje in vzdrževanje orodij) zagotavlja Center za jezikovne vire in tehnologije Univerze v Ljubljani, tudi član konzorcija CLARIN.SI.

Dr. Iztok Kosem ob predstavitvi orodja SENTA v Zbornični dvorani Univerze v Ljubljani. Foto: STA
Dr. Iztok Kosem ob predstavitvi orodja SENTA v Zbornični dvorani Univerze v Ljubljani. Foto: STA

Orodje SENTA za poenostavljanje in analizo besedil. Ta je namenjena tudi osebam z oviranostjo. Na kakšen način deluje in kako je lahko v pomoč osebam z oviranostjo?

Orodje SENTA najprej analizira besedilo in poenostavi tiste povedi, ki jih prepozna kot kompleksne. Nato uporabniku ponudi ogled izvirnega in poenostavljenega besedila, pri čemer za vsako besedilo opravi tudi analizo glavnih značilnosti, npr. število besed, znakov, delež besed, ki so v slovenščini redkejše oz. jih ne najdemo na referenčnem splošnem ali učbeniškem seznamu. Vse te informacije so v pomoč uporabniku pri preverjanju končne verzije besedila, ki ga lahko v orodju tudi nadalje ureja. Pri tem si lahko pomaga tudi s preklopom v prikaz po stavkih, ki ponuja preglednejši ogled in urejanje poenostavljenih povedi.

Z vidika dostopnosti smo na delavnicah z osebami z oviranostjo, ki jih je organiziralo Društvo študentov invalidov Slovenije, ugotovili, da je orodje koristno zlasti za osebe z motnjami v duševnem razvoju in osebe z učnimi težavami ter za izdelovalce učnih gradiv za takšne osebe.

Bo pri orodju SENTA prihajalo do posodobitev in kakšni so načrti za prihodnost? Tudi širše na področju orodij za dostopnost.

Vzdrževanje orodja SENTA je zdaj prevzel Center za jezikovne vire in tehnologije. Nadgradnje SENTE, pa tudi ostalih virov in orodij, so načrtovane, vendar pa so odvisne tudi od razpoložljivosti finančnih sredstev. Sredstva CJVT so namreč omejena in z njimi zagotavljamo predvsem delovanje in obstoj obstoječe jezikovne infrastrukture, ki je nastala v okviru številnih preteklih projektov (kot je bil npr. Razvoj slovenščine v digitalnem okolju). Sredstva za nadgradnje zaenkrat pridobivamo predvsem s prijavami na razpise, npr. Ministrstva za kulturo – tako bo recimo nadgradnja slovarskih virov v naslednjih letih potekala v nedavno odobrenem projektu PODVIG (Podatkovna dopolnitev in igrifikacija slovarskih virov na CJVT UL).