Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

A magyar nyelv a digitális korban — Vezetői összefoglaló

Az információs technológia jelentősen megváltoztatta mindennapi életünket. Jellemzően számítógépet használunk írásra, szerkesztésre, számolásra és információkeresésre, továbbá egyre inkább olvasásra, zenehallgatásra, fotó- és filmnézésre. Kis számítógépeket hordunk a zsebünkben, és használjuk őket telefonálásra, e-mailírásra, információszerzésre és szórakozásra, bármerre is járunk. Milyen hatással van az információnak, a tudásnak és a mindennapi kommunikációnak ez a masszív digitalizálódása a nyelvünkre? Megváltozik a nyelvünk, vagy eltűnik? Számítógépeink egy nagy és erőteljes globális hálózat részeit képezik. A lány Ipanemában, a hivatalnok Budapesten és a mérnök Delhiben ugyanúgy tudnak csetelni a barátaikkal a Facebookon, de nem valószínű, hogy valaha is találkoznak egymással online közösségekben vagy fórumokon. Ha azon aggódnak, hogy hogy lehet kezelni a fülfájást, akkor mindannyian a Wikipédiát fogják megnézni, de nem ugyanazt a cikket fogják olvasni. Amikor európai netezők a fukushimai atomkatasztrófának az európai energetikai piacra gyakorolt hatásairól beszélgetnek a fórumokon, akkor ezt jellemzően nyelvileg szeparált közösségekben teszik. Amit az internet összeköt, azt a használók nyelvi korlátai még mindig szétválasztják. Ez vajon mindig így lesz? A világ 6000 nyelve közül sok nem fog életben maradni egy globalizált digitális információs társadalomban. Becslések szerint legalább 2000 nyelv kihalásra van ítélve a következő évszázadokban. Mások szerepet fognak ugyan játszani a családi és ismerősi körben, de a szélesebb üzleti és tudományos szférában nem. Milyenek a magyar nyelv esélyei a túlélésre?

Becslések szerint a magyar nyelvet összesen 13 millióan beszélik, ezzel a 12. helyen áll a legtöbb beszélővel rendelkező nyelvek listáján Európában. A Magyar Köztársaság államnyelve, ahol a 10 milliós lakosságnak kb. 97%-a magyar anyanyelvű. A szomszédos hét országban is találunk magyar nyelvű közösségeket, amelyek közül a legnagyobb a romániai, megközelítőleg másfél millió nyelvhasználóval. Ezen felül emigráns közösségek használják világszerte, elsősorban az Amerikai Egyesült Államokban, Kanadában és Izraelben.

A magyar nyelv szigetet alkot Európában, ugyanis a legtöbb európai nyelv az indoeurópai nyelvcsaládba tartozik, de a magyar nem. A magyar finnugor nyelv, rokonai a finn, az észt és néhány más, Oroszországban élő népek által beszélt nyelv. A magyar nyelv a legtöbb beszélővel rendelkező nem indoeurópai nyelv Európában, de – ellentétben olyan világnyelvekkel, mint az angol vagy a kínai, és az olyan gyakran használt európai nyelvekkel, mint a német vagy a francia – a magyar nem játszik prominens szerepet nemzetközi szinten.

Sokan panaszkodnak Magyarországon az anglicizmusok egyre erősödő használata miatt, és attól tartanak, hogy a magyar nyelvet elárasztják az angol szavak és kifejezések. Ez a megközelítés félrevezető. A magyar nyelv már túlélte az új szavak hatását, melyeket különböző török nyelvekből vettünk át a honfoglalás előtti korban, és túlélte az erős szláv hatást is a Kárpát-medencében. Később az Oszmán Birodalom része volt az ország 150 évig, majd a Habsburg Birodalom ideje alatt a latin és a német nyelv hatása volt nagyon erős. Kedves kis magyar szavaink elvesztésének egy jó ellenszere, ha használjuk őket – gyakran és tudatosan. Nyelvészeti polémiák az idegen befolyásról és kormányzati rendelkezések nem segítenek. Nem a nyelvünk fokozatos anglicizálódása miatt kellene aggódnunk, inkább amiatt, hogy nyelvünk a személyes élet főbb területeiről eltűnhet. Nem a tudományra, a légiirányításra vagy a globális üzleti piacra gondolunk, hanem az élet olyan területeire, ahol sokkal fontosabb, hogy a nyelv közel álljon az ország lakóihoz, mint nemzetközi partnerekhez, ilyenek például a helyi szokások, az ügyintézés, a törvényalkotás, a kultúra és a vásárlás.

Egy nyelv státusza nem csak beszélőinek számától függ, hanem attól is, hogy mennyire van jelen az információs térben és a szoftveralkalmazásokban. Egy meglehetősen aktív magyar nyelvű webes közösség létezéséről tanúskodik az, hogy a magyar Wikipédia a 19. legnagyobb, megelőzve olyan több beszélővel rendelkező európai nyelveket, mint a török, a román vagy a dán, és olyan világnyelveket, mint az arab vagy a koreai. Néhány fontos nemzetközi szoftver magyar változatban is elérhető, azonban a magyar nyelv specialitása megnehezíti az angolalapú alkalmazások adaptálását. A költséges magyar nyelvű technológiák fejlesztését az is hátráltatja, hogy a magyar piac meglehetősen kicsi.

Ami a nyelvtechnológiát illeti, a magyarországi helyzet óvatos optimizmusra ad okot. Nagyrészt állami, az utóbbi időben európai támogatással, de létezik nyelvtechnológiai kutatás Magyarországon. A jelenleg futó két európai, Magyarország által koordinált ICT projekt közül mindkettő nyelvtechnológiai témájú. Számos technológia és erőforrás áll rendelkezésre a magyar nyelvre, bár közel sem annyi, mint az angolra, és ezek nem elégségesek egy valódi többnyelvű tudásalapú társadalom igényeinek kielégítésére.

Az információs és kommunikációs technológia már a következő forradalomra készül. A személyi számítógépek, hálózatok, miniatürizáció, multimédia, mobileszközök és a cloud technológia után a következő generációba olyan szoftverek fognak tartozni, amelyek nem csak a kiejtett hangokat vagy a leírt betűket, hanem a szavakat és a mondatokat is értik, és a felhasználókat jobban támogatják azáltal, hogy beszélik és értik a nyelvüket. Ezeknek a fejlesztéseknek az előfutárai az olyan szabadon elérhető online szolgáltatások, mint a Google Translate, amely 57 nyelv között fordít, vagy európai versenytársa, az itranslate4.eu (egy Magyarország által vezetett konzorcium terméke), továbbá az IBM szuperszámítógépe, Watson, amely megverte a Jeopardy nevű játék amerikai bajnokát, és az Apple mobilalkalmazása, a Siri, amely reagál a hangvezérlésre, és válaszol angol, német, francia és japán nyelven.

Az információs technológia következő generációja olyan szintű nyelvi képességgel fog rendelkezni, hogy az emberi felhasználók saját nyelvükön tudnak majd kommunikálni ezt a technológiát használva. Az eszközök képesek lesznek automatikusan megtalálni a legfontosabb híreket és információkat a világ digitális tudásbázisából – mindezt könnyen használható hangvezérléssel. A nyelvtechnológia képes lesz automatikusan fordítani, vagy segíteni a tolmácsok munkáját; beszélgetéseket és dokumentumokat összefoglalni; és támogatni a felhasználókat a tanulásban.

Az információs és kommunikációs technológia következő generációja eléri az ipari robotokat is (jelenleg fejlesztés alatt áll a kutatólaboratóriumokban), melynek következményeképpen érteni fogják, hogy a felhasználó mit akar, és még be is számolnak az eredményekről.

A teljesítménynek ez a szintje azt jelenti, hogy túl kell lépni az egyszerű karakterhalmazokon, szótárakon, helyesírás-ellenőrzőkön és kiejtési szabályokon. A technológiának meg kell haladnia az egyszerűsítő megközelítéseket, és el kell kezdenie olyan nyelvmodelleket gyártani, amelyek figyelembe veszik a szintaxissal együtt a szemantikát is ahhoz, hogy megértsék a kérdések sorát, és releváns válaszokat adjanak rájuk.

Azonban az angol és a magyar nyelv között hatalmas technológiai szakadék tátong, és egyre mélyül. A kutatás-fejlesztési támogatások folytonossága nem megfelelő. Rövid távú programok váltják egymást alacsony támogatású időszakokkal, és az EU-s országok és az Európai Bizottság programjainak koordinációjában is általános hiányosságok mutatkoznak. Ennek eredményeképpen Magyarország (és az EU általában) több nagyon ígéretes innovációt vesztett az Amerikai Egyesült Államokkal szemben, ahol a stratégiai kutatások tervezésében nagyobb kontinuitás tapasztalható, és ahol jobban támogatják az új technológiák piacra kerülését. A technológiai innováció versenyében csak egy jövőbe mutató koncepcióval rendelkező korai start biztosíthat versenyelőnyt, persze csak akkor, ha valóban eléri a célt. Különben minden amit elérünk, csak egy tiszteletbeli említés a Wikipédiában.

Mindezek ellenére még mindig nagy kutatói potenciál rejlik Magyarországban és az EU-ban. A nemzetközileg is elismert kutatóközpontokon és egyetemeken kívül számos innovatív nyelvtechnológiai kis- és középvállalkozás működik, melyek nagy kreativitással és hatalmas erőfeszítésekkel próbálnak túlélni, stabil támogatás és kockázati tőke hiányában is.

Habár Magyarország fontos fejlesztéseket támogatott a korpuszépítés és a nyelvi erőforrások létrehozása terén, a magyar nyelvtechnológiai erőforrások és eszközök még mindig nem érik el minőségben és lefedettségben angol nyelvű megfelelőik színvonalát, amelyek majd minden nyelvtechnológiai területen az élvonalat képviselik. Minden nemzetközi nyelvtechnológiai verseny azt mutatja, hogy az eredmények az angol nyelv automatikus elemzése terén sokkal jobbak, mint ugyanezek a magyarra. Ez igaz az információkinyerésre, a nyelvi ellenőrzésre, a gépi fordításra és sok más alkalmazásra is.

Sok kutató szerint ez annak köszönhető, hogy az elmúlt ötven évben a számítógépes nyelvészeti módszerek és algoritmusok, valamint a nyelvtechnológiai alkalmazások fejlesztése elsősorban az angolra fókuszált. Más kutatók azt gondolják, hogy az angol jellegénél fogva alkalmasabb a számítógépes feldolgozásra, továbbá az olyan nyelvek, mint a spanyol vagy a francia, szintén könnyebben kezelhetők a jelenlegi módszerekkel, mint a magyar. Ez azt jelenti, hogy következetes és fenntartható erőfeszítéseket kell tennünk a kutatás terén, ha a következő generációs infokommunikációs technológiákat magyarul akarjuk használni privát és hivatalos életünkben is.

Összefoglalva: a magyar nyelv romlásáról szóló próféciák ellenére nyelvünk nincs veszélyben, még az angol nyelv erejével szemben sem. Viszont a helyzet drámaian megváltozhat akkor, amikor a technológiák új generációja elkezdi valóban hatékonyan kezelni az emberi nyelvet. A gépi fordítás tökéletesítése által a nyelvtechnológia segít a nyelvi korlátok ledöntésében, de csak azon nyelvek esetében, amelyek képesek fennmaradni a digitális világban. Ha létezik használható nyelvtechnológia, akkor még a kevés beszélővel rendelkező nyelvek is biztosíthatják túlélésüket. Ha nem, akkor még a nagyobb nyelvek is erőteljes nyomás alá kerülhetnek.

A fogorvos tréfás intése: ,,Csak azt a fogát mossa, amelyet meg akar tartani!” Ez a mondás a kutatási politikára is igaz – egy kikötéssel: megtanulhatsz minden nyelvet, ami csak létezik a nap alatt, de költséges technológiákat csak azokra fejlessz, amelyeket igazán életben akarsz tartani.