Na Inštitutu za medijske komunikacije smo pričeli z aktivnim sodelovanjem na projektu Razvoj slovenščine v digitalnem okolju, ki ga financira Ministrstvo za kulturo republike Slovenije.
O projektu
Razvoj jezikovnih tehnologij je ključnega pomena za preživetje jezika v digitalni dobi, saj se sicer ne bodo mogli vključiti v nove načine komunikacije, metode dela ter preživljanja prostega časa, ki bodo na voljo v prihodnosti. Del te nevarnosti lahko že opazimo v segmentu pametnih asistentov, s katerimi se že danes lahko pogovarjamo – vendar le v nekaj jezikih (Amazon Alexa, 8 jezikov, Google Assistant, 13 jezikov in Apple Siri, 21 jezikov). S projektom Razvoj slovenščine v digitalnem okolju želimo slovenščino pripeljati v družbo teh jezikov.
Cilji projekta
Naš glavni cilj je zadovoljiti potrebe po računalniških izdelkih in storitvah s področja jezikovnih tehnologij za slovenski jezik za raziskovalne organizacije, za podjetja in za širšo javnost. Končni izdelki bodo na uporabniško prijazen način pomagali pri sporazumevanju, sodelovanju, poslovanju, izmenjavi znanja in udeleževanju v družabnih in političnih razpravah, in prispevali k premagovanju jezikovnih meja.
Vsa programska koda in zbirke podatkov, ki bodo nastale med projektom, bodo dostopne javno pod odprtokodno licenco, vse aplikacije (prepoznava govora, transkripcija, strojno prevajanje, terminološki portal in luščenje terminologije) pa bodo (po vzoru latvijskega portala hugo.lv na voljo tudi na javnem portalu RSDO, kjer jih bo vsak lahko preizkusil in uporabljal.
Partnerji
Konzorcij sestavlja dvanajst ustanov, med katerimi so največje izobraževalne in raziskovalne organizacije v Sloveniji – tri univerze in tri javne raziskovalne organizacije – ter šest podjetij:
V okviru Univerze v Ljubljani (UL) kot koordinatorice konzorcija pri projektu sodeluje pet fakultet, ustanoviteljic Centra za jezikovne vire in tehnologije UL (CJVT): Fakulteta za računalništvo in informatiko (FRI), Fakulteta za elektrotehniko (FE), Filozofska fakulteta (FF), Fakulteta za družbene vede (FDV), Pedagoška fakulteta (PEF), poleg tega Fakulteta za upravo (FU). V okviru Univerze v Mariboru (UM) pri projektu sodelujejo: Fakulteta za elektrotehniko, računalništvo in informatiko (FERI), Pedagoška fakulteta (PEF) ter Fakulteta za organizacijske vede (FOV). V okviru Univerze v Novi Gorici (UNG) sodeluje Fakulteta za humanistiko.
Na Institutu »Jožef Stefan« (IJS) sta v projekt vključeni dve enoti: Odsek za tehnologije znanja ter Laboratorij za umetno inteligenco, ki na IJS upravljata infrastrukturo CLARIN.SI. Ta je del evropske infrastrukture CLARIN ERIC, ki spada med dolgoročno vzdrževane evropske infrastrukture ESFRI.
Na Znanstvenoraziskovalnem centru SAZU (ZRC) v projektu sodeluje Inštitut za slovenski jezik Frana Ramovša (ISJFR), osrednja ustanova, namenjena sistematičnemu spremljanju in razlagi slovenskega jezikovnega gradiva, ki vzdržuje slovarski portal Fran kot del svoje raziskovalne infrastrukture. ZRC skupaj z IJS sodeluje tudi pri drugi ESFRI infrastrukturi s področja humanistike, DARIAH-SI, ki jo v Sloveniji koordinira Inštitut za novejšo zgodovino (INZ).
Obstoječe infrastrukture, na čelu s CLARIN.SI, ki so financirane bodisi s strani ARRS ali z evropskimi sredstvi in so namenjene vzdrževanju in dostopu do jezikovnih virov in tehnologij za slovenski jezik, zagotavljajo tudi dolgoročno dostopnost in vzdrževanje rezultatov po koncu projekta.
V raziskovalni infrastrukturi CLARIN.SI od njene vzpostavitve l. 2013 poleg univerz in raziskovalnih organizacij sodelujeta tudi dve podjetji, ki že dlje časa v slovenskem prostoru delujeta na področju razvoja jezikovnih virov in tehnologij, Alpineon, d.o.o. in Amebis, d.o.o. Obe poleg članstva v CLARIN.SI vse od 90-ih let prejšnjega stoletja (Amebis) izkazujeta vrsto sodelovanj z drugimi ustanovami na tem področju, kar je razvidno iz izkazanih referenc. Poleg omenjenih v projektnem konzorciju sodelujeta dve novoustanovljeni podjetji, Aikwit d.o.o. ter Vitasis, d.o.o., prvo deluje na področju nudenja prevajalskih uslug, drugo na področju informacijskih tehnologij. Vsa podjetja bodo v prakso prenašala novo nastale izdelke, od strojnega prevajanja do govornih tehnologij. Preostali dve podjetji, Slovenska tiskovna agencija d.o.o. in Pošta Slovenije d.o.o., sta v državni lasti in sta vključeni kot pomembna uporabnika novo razvitih jezikovnotehnoloških izdelkov. Imata predvsem vlogo evalvatorjev izdelkov v času razvoja ter diseminatorjev projektnih rezultatov med in po koncu projekta.
Ključna nosilca izvedbe na tehnološki strani sta dve tehniški fakulteti na univerzah v Ljubljani in v Mariboru: UL FRI in UM FERI. V sklopu 2 (govorne tehnologije) pomembno prispevata tudi UL FE ter podjetji Alpineon in Vitasis, slednje tudi v sklopu 4 (strojno prevajanje), skupaj z Aikwit. Ključna nosilca izvedbe na jezik(oslo)vni strani sta UL FF in ISJFR, ob sodelovanju UNG in INZ. V partnerstvu z ISJFR podjetje Amebis prispeva predvsem v petem sklopu (terminološki portal). Institut »Jožef Stefan« je v celoti zadolžen za izvajanje šestega sklopa (vzdrževanje infrastrukturnega centra za jezikovne vire in tehnologije), sodelavci z jezikovnotehnološkimi znanji pa bodo vključeni tudi v večino drugih sklopov.