Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

Lietuvių kalba skaitmeniniame amžiuje — Santrauka

Per pastaruosius 60 metų Europa įgijo aiškią politinę ir ekonominę struktūrą, tačiau kultūros ir kalbų požiūriu ji vis dar labai skirtinga. Taigi nuo portugalų iki lenkų, nuo italų iki islandų – kiekvieną dieną bendraudami visuomenės, verslo ir politikos srityse Europos piliečiai neišvengiamai susiduria su kalbų barjerais. Europos Sąjungos institucijos per metus išleidžia apie milijardą eurų daugiakalbystės politikai įgyvendinti, t.y. versti rašytinius tekstus ir žodinę komunikaciją. Tačiau ar ši našta turėtų būti tokia milžiniška? Šiuolaikinės kalbos technologijos ir moksliniai kalbų tyrimai gali labai padėti griaunant tokius kalbų barjerus. Kalbos technologijos, įdiegtos išmaniuosiuose prietaisuose ir programose, ateityje galės padėti europiečiams lengvai susikalbėti ir bendradarbiauti, net jei jie kalba skirtingomis kalbomis.

Lietuvos ūkis turi didžiulės naudos iš Europos bendrosios rinkos: 2010 metais prekyba su Europos Sąjunga sudarė 61 proc., o su kitomis Europos šalimis – dar 3 proc. viso Lietuvos eksporto. Tačiau kalbų barjerai gali stabdyti verslą, ypač jei kalbame apie mažas ir vidutinio dydžio įmones, neturinčias lėšų pakeisti situaciją.

Alternatyva tokiai daugiakalbei Europai būtų leisti įsigalėti vienai kalbai, kuri ilgainiui pakeistų visas kitas kalbas. Tačiau tai sukeltų sunkumų įvairiakalbiams Europos piliečiams.

Klasikinis būdas įveikti kalbų barjerus – mokytis užsienio kalbų. Tačiau išmokti 23 oficialiąsias ir dar beveik 60 kitų Europos kalbų nesinaudojant technologijomis europiečiams būtų neįveikiama užduotis ir kliūtis siekiant Europos ekonominės, politinės ir mokslinės pažangos. Geriausia išeitis – kurti plačių galimybių technologijas (angl. key enabling technology). Jos suteikia Europos rinkos dalyviams didžiulio pranašumo ne tik Europos bendrojoje rinkoje, bet ir palaikant prekybinius ryšius su trečiųjų šalių besivystančiomis rinkomis. Pagaliau kalbos technologijų sprendiniai turėtų tapti tiltais, jungiančiais įvairias Europos kalbas.

Informacinės technologijos keičia mūsų kasdienį gyvenimą. Paprastai kompiuterius naudojame tekstams rašyti, redaguoti, skaičiuoti, ieškoti informacijos ir vis dažniau – klausytis muzikos, peržiūrinėti nuotraukas ir filmus. Su savimi nešiojamės kišeninius kompiuterius, kuriais galime skambinti, rašyti elektroninius laiškus, gauti informacijos ir susirasti pramogų, kur bebūtume. Kokia yra šio plataus informacijos, žinių ir kasdienio bendravimo skaitmeninimo įtaka mūsų kalbai? Ar mūsų kalba pasikeis, o gal iš viso išnyks?

Dauguma šiuo metu pasaulyje egzistuojančių 6 000 kalbų globalizuotoje skaitmeninėje informacinėje visuomenėje neišgyvens. Manoma, kad ne mažiau nei 2 tūkst. kalbų artimiausiais dešimtmečiais lemta išnykti. Kitos bus vartojamos šeimose ir miestų rajonuose, tačiau tikrai ne platesniame verslo ir mokslo pasaulyje. Kokios yra lietuvių kalbos galimybės išlikti? Kalbos statusas priklauso ne vien nuo ja kalbančių žmonių ar ja parašytų knygų, sukurtų kino filmų ir ja transliuojančių televizijos stočių skaičiaus, bet ir nuo kalbos vartojimo skaitmeninėje informacinėje erdvėje bei programinei įrangai kurti. Tai aktualu lietuvių kalbai, kuri yra viena iš mažiau vartojamų, ne tokių patrauklių rinkos požiūriu Europos kalbų – ja kalba apie 4 mln. žmonių, dauguma jų gyvena Lietuvos Respublikoje. Lietuvių kalba turi valstybinės kalbos statusą, įtvirtintą Lietuvos Respublikos Konstitucijoje, šio statuso apsaugą ir valstybinės kalbos vartojimą reglamentuoja Valstybinės lietuvių kalbos įstatymas bei kiti teisės aktai. Be to, kalba, kaip kultūrinės tapatybės dalis, įtraukta į kultūrinio ir etninio paveldo apsaugos teisės aktus. „Lietuvos informacinės visuomenės plėtros“ 2011–2019 metų programoje yra iškeltas strateginis tikslas – pagerinti Lietuvos gyventojų gyvenimo kokybę ir įmonių veiklos aplinką naudojantis informacinių ir ryšių technologijų (IRT) teikiamomis galimybėmis ir pasiekti, kad iki 2019 metų ne mažiau kaip 85 proc. Lietuvos gyventojų naudotųsi internetu. Šio tikslo prioritetas yra elektroninio turinio ir paslaugų plėtra, jų naudojimo skatinimas. Prioritetui pasiekti Lietuvos Vyriausybė kelia du uždavinius: 1. skaitmeninti Lietuvos kultūros paveldo objektus ir jų pagrindu kurti viešai prieinamus skaitmeninius produktus, taip užtikrinti skaitmeninio turinio išsaugojimą ir sklaidą elektroninėje erdvėje; 2. diegti lietuvių kalbos skaitmeninius produktus į IRT, siekiant užtikrinti visavertį lietuvių kalbos (rašytinės ir šnekamosios) funkcionavimą visose valstybės gyvenimo srityse. Ar šių politinių pastangų pakaks įtvirtinant lietuvių kalbą Europos daugiakalbėje informacinėje erdvėje?

Lietuvai tapus Europos Sąjungos nare, prasidėjo naujas lietuvių kalbos raidos etapas – įgytas oficialios Europos Sąjungos kalbos statusas užtikrino lietuvių kalbos vartojimą ir sklaidą Europos Sąjungos institucijose, paspartėjo kalbos išteklių bei technologijų, reikalingų visaverčiam kalbos funkcionavimui daugiakalbėje aplinkoje, kūrimas ir diegimas. Vis dėlto lietuvių kalba yra viena iš vadinamųjų „nekomercinių“ Europos kalbų, todėl plėtojant kalbos technologijas ji susiduria su sunkumais ir problemomis, būdingomis mažiau vartojamų kalbų raidai. Šių technologijų plėtra labai priklauso nuo kitų šalių patirties ir jų paramos bei tarptautinio bendradarbiavimo. Kita vertus, kalbos technologijų plėtojimas yra svarbiausia lietuvių kalbos funkcionalumo, žinomumo ir studijų bei lietuviškos kultūros sklaidos daugiakalbėje Europoje stiprinimo proceso sudedamoji dalis. Lietuvių kalbos visavertis funkcionavimas skaitmeninėje erdvėje tapo ypač svarbiu lietuvių kalbos išlikimo ir sklaidos veiksniu. Informacinėje visuomenėje kalbos gyvybingumą ir patrauklumą lemia galimybės greitai ir patogiai keistis daugiakalbe informacija, gauti paslaugas ir pan. Informacinės technologijos lietuvių kalbai atveria naujus bendravimo, tekstų rengimo, informacijos sklaidos ir paieškos būdus. Šiuolaikinių komunikacijų greitis ir geografinė aprėptis palengvina bendravimą lietuvių kalba, daugėja lietuviško turinio ir paslaugų internete, kuriami įrankiai, padedantys vartoti taisyklingą kalbą, tenkinantys specialiuosius vartotojų poreikius ir pan. Kita vertus, pokyčiai šioje srityje tokie spartūs, kad lietuvių kalbos planavimas ir plėtra nebespėja laiku spręsti visų iššūkių. Vartotojams greičiau ir paprasčiau pasiekiami produktai ir informacija anglų kalba lemia palyginti menką lituanizuotos programinės įrangos populiarumą, lėtą kalbos technologijų ir įrankių diegimą bei sklaidą, nepakankamą skaitmeninių kalbos išteklių ir įrankių plėtrą.

Lietuvoje, kaip ir daugelyje Europos šalių, kalbos technologijų erdvė yra netolygiai plėtojama. Moksliniai tyrimai leido sėkmingai sukurti gana kokybišką programinę įrangą bazinei teksto analizei, pavyzdžiui, įrankius morfologinei ir sintaksinei analizei. Tačiau pažangesnių technologijų, kurioms reikia nuodugnesnio lingvistinio apdorojimo ir semantinių žinių, kol kas tėra tik užuomazgos. Parengta nemažai pirminių skaitmeninių kalbos išteklių (elektroninių žodynų, tekstynų, terminynų) ir pagrindinių kalbos analizės priemonių (morfologinių požymių nustatymo ir generavimo, rašybos tikrinimo įrankių), sukurtas lietuviškas sintezatorius, lietuvių ir anglų kalbų automatinio vertimo sistemos, sulietuvinta programinė įranga, sukurtas originalus lietuviškas kompiuterinis šriftas Palemonas, pritaikytas mokslo reikmėms. Tačiau daugelį sukurtų išteklių, produktų ir sistemų reikia nuolat atnaujinti ir plėtoti, kad jie atitiktų kintančius vartotojų poreikius. Menkai išplėtoti semantikos tyrimai lėmė mažesnę kalbos generavimo, teksto interpretavimo ir teksto analizės pažangą. Nors sukauptos gana gausios ir išsamios leksikos duomenų bazės, tačiau nėra WordNet, tezauro ir pan. Taip pat trūksta reikiamo lygio kalbos technologijoms pritaikytos lietuvių kalbos gramatikos, sintaksiškai anotuotų tekstynų.

Kuriant išmanesnes ir sudėtingesnes priemones, tokias kaip automatinis vertimas, reikia išteklių ir technologijų, kurie apimtų daugiau lingvistinių aspektų ir leistų semantiškai nuodugniau analizuoti įvedamą tekstą. Gerindami kai kurių bazinių išteklių kokybę ir aprėptį, turėtume gebėti atverti naujas galimybes įsiveržti į pažangesnių technologijų taikymo sritis.

Kol kas lietuvių kalbai pritaikytų technologijų erdvė kokybiškai gana fragmentuota ir menkai sąveiki. Esami kalbos ištekliai, kurie galėtų būti pritaikyti kalbos technologijoms, sukurti atskirų institucijų, mokslininkų grupių ar verslo įmonių nesilaikant bendrų standartų, todėl jų pritaikomumas kalbos technologijoms yra ribotas arba ekonomiškai neefektyvus, turint galvoje išteklių pertvarkymą pagal naujus standartus. Šiuo metu Lietuvoje vykdoma keletas projektų, pagal kuriuos tarptautiniai standartai diegiami senesniuose ištekliuose (pvz., Dabartinės lietuvių kalbos tekstyne) ar kuriami nauji produktai. Didesnis sąveikumas leistų lengviau kurti bendrai Europos kalbinei erdvei būtinus integruotus produktus, tokius kaip daugiakalbiai automatinio vertimo įrankiai, žodynai, semantinės informacijos paieškos priemonės, mažintų lietuviškai kalbančios visuomenės atskirtį, didintų lietuvių kalbos tarptautinį prestižą ir prieinamumą.

Lietuvoje spartesnė informacinės visuomenės plėtra, susidomėjimas kalbos technologijomis ir išteklių kaupimas prasidėjo vos prieš keletą dešimtmečių, todėl norint sukurti tikrai veiksmingų, kasdieniam vartojimui skirtų kalbos technologijų, reikės atlikti nemažai mokslinių tyrimų. Nedidelė kalbos technologijų ir įrankių naudotojų rinka, neišplėtota ir susiskaidžiusi mokslo tyrimų ir studijų infrastruktūra, aiškių prioritetų ir koordinavimo trūkumas neskatina privataus verslo iniciatyvų. Šiuo metu kalbos technologijų srityje dirba keletas įmonių, verslas mažai užsako mokslinių tyrimų.

Kalbos technologijų būklė Lietuvoje teikia pagrindo nuosaikiam optimizmui. Lietuvos Respublikos Vyriausybė pabrėžia siekį užtikrinti kalbos technologijų plėtrą – tai rodo įvairių vyriausybinių institucijų ir Europos Sąjungos struktūrinių fondų finansuojamos programos, pagal kurias kuriamos ir tobulinamos kalbos technologijos. Proveržiai kalbos technologijų srityje skatintų jų diegimą pramonėje, padėtų plėsti ir gerinti viešąsias paslaugas ir pan., taip pat suteiktų galimybę lietuvių kalbą vartoti visose gyvenimo srityse ir komunikacijos terpėse.

Europos kalboms sukurtų ir pritaikytų technologijų skaičius ir jų pritaikymo lygmuo yra gana skirtingas. Žinoma, skiriasi ir veiksmai, kurių reikėtų imtis norint paskatinti konkrečios kalbos technologijų mokslinius tyrimus ir plėtrą, pasirengimas taikyti kalbinius sprendinius ir mokslinių tyrimų lygis. Norint sukurti tikrai veiksmingų, kasdieniam vartojimui skirtų kalbos technologijų, Lietuvai reikės atlikti nemažai tyrimų ir sukurti papildomų išteklių, įrankių, integruoti juos, užtikrinant kuo didesnę sąveiką. Šie tikslai numatyti 2011 metais prasidėjusioje nacionalinėje programoje „Lietuvių kalba informacinėje visuomenėje“.

META-NET tinklo ilgalaikis uždavinys – pristatyti kokybiškas kalbos technologijas, taikomas visose Europos kalbose, siekiant kultūrine įvairove pagrįstos politinės ir ekonominės vienybės. Šios technologijos padės sugriauti dabartinius barjerus ir nutiesti tiltus tarp Europos kalbų. Visos suinteresuotosios šalys – politikai, tyrėjai, verslo ir visuomenės atstovai – turi suvienyti savo pastangas, kurdami bendrą ateitį.

Ši Baltųjų knygų serija papildo kitus META-NET tinklo strateginius veiksmus, apžvelgiamus šio dokumento priede. Aktualios informacijos, pavyzdžiui, META-NET tinklo vizijos dokumento naujausią versiją arba strateginių mokslinių tyrimų darbotvarkę galima rasti META-NET tinklalapyje: http://www.meta-net.eu.