Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

Čeština v digitálním věku — Shrnutí

Evropa se během posledních 60 let stala zřetelnou politickou a ekonomickou sítí, přesto je ale kulturně a jazykově stále velmi různorodá. Znamená to, že každodenní komunikace mezi evropskými občany (ať už přecházíme z portugalštiny do polštiny nebo z italštiny do islandštiny) i komunikace v oblasti podnikání a politiky se nevyhnutelně potýká s jazykovou bariérou.

Orgány EU utratí asi jednu miliardu eur ročně na překládání textů a tlumočení mluvené komunikace, aby řešily otázku mnohojazyčnosti. Musí to však být taková zátěž? Moderní jazykové technologie (language technology, LT) a lingvistický výzkum mohou významně přispět k bourání jazykových hranic. Když se jazykové technologie spojí s inteligentními zařízeními a aplikacemi, budou v budoucnosti schopné pomáhat Evropanům jednoduše komunikovat a obchodovat, i když nemluví společnou řečí. Česká ekonomika má na jednotném evropském trhu velkou výhodu. Přesto je možné, že jazykové bariéry způsobí např. zánik některých podniků, a to zejména jedná-li se o malé a střední podniky, které nemají finanční prostředky na zlepšení situace. Jedinou (i když nemyslitelnou) alternativou řešení otázky mnohojazyčné Evropy by bylo umožnit, aby jeden jazyk získal dominantní postavení a nakonec nahradil všechny ostatní. Bez technologické podpory, je zvládnutí 23 oficiálních jazyků členských států Evropské unie a dalších cca 60 evropských jazyků nepřekonatelná překážka pro občany našeho kontinentu, pro jejich ekonomiku, jejich politickou diskusi a vědecký pokrok. Řešením je vybudování klíčových technologií, které budou nabízet evropským subjektům velké výhody, a to nejen v rámci společného evropského trhu, ale i v obchodních vztazích se třetími zeměmi, zejména v nově se etablujících ekonomikách. Abychom dosáhli tohoto cíle a uchránili evropskou kulturní a jazykovou rozmanitost, musíme nejprve provést systematickou analýzu jazykových aspektů všech evropských jazyků a analýzu současného stavu podpory jazykových technologií. Pak budou moci jazykové technologie sloužit jako jedinečný most mezi evropskými jazyky. Nástroje pro automatický překlad a zpracování řeči, které jsou v současné době dostupné na trhu, ovšem stále ještě tohoto náročného cíle nedosahují. Dominantní subjekty v této oblasti jsou převážně soukromé podniky se sídlem v Severní Americe.

Již na konci 70. let si EU uvědomila nesmírný význam jazykových technologií jako nástroje k dosažení evropské jednoty a začala financovat první výzkumné projekty, např. EUROTRA. Ve stejné době začaly vznikat vnitrostátní projekty, které sice přinášely cenné výsledky, ale nikdy nevedly k evropské spolupráci. Ostatní mnohojazyčné komunity jako Indie (22 úředních jazyků) a Jihoafrická republika (11 úředních jazyků) naopak na rozdíl od tohoto vysoce selektivního financování nedávno vytvořily dlouhodobé národní programy pro jazykový výzkum a technologický rozvoj. Dominantní subjekty v oblasti jazykových technologií se dnes spoléhají na nepřesné statistické postupy, které nevyužívají propracované jazykovědné metody a znalosti. Například automatický překlad vět funguje na principu porovnávání věty, kterou chceme automaticky přeložit, s tisíci jinými, které byly přeloženy lidmi. Kvalita výstupu do značné míry závisí na velikosti a kvalitě daného vzorku. Zatímco automatický překlad textu může u „velkých“ jazyků s jednoduchou morfologickou strukturou dosáhnout přiměřené kvality, u složitějších jazyků nebo u jazyků s nižším počtem příkladového materiálu je tato statistická metoda odsouzena k neúspěchu. Evropská unie se proto rozhodla financovat projekty, jako je EuroMatrix, EuroMatrixPlus (fungující od roku 2006) a iTranslate4 (fungující od roku 2010), které provádějí základní a aplikovaný výzkum a snaží se vytvořit vysoce kvalitní jazykové technologie pro všechny evropské jazyky. Hlubší analýza struktury jazyků je jedinou možnou cestou, jak vytvářet aplikace, které fungují v rámci celé škály evropských jazyků dobře. Evropský výzkum dosáhl v této oblasti již řady úspěchů. Například překladatelské služby v Evropské unii nyní používají MOSES, open-source software pro strojový překlad, který byl vyvinut zejména prostřednictvím evropských výzkumných projektů. Spíše než stavět na výsledcích těchto projektů má Evropa tendenci pokračovat v izolované výzkumné činnosti jen s nepatrným vlivem na trh. Ekonomickou hodnotu počátečního úsilí lze vidět na počtu prodaných dceřiných společností. Např. společnost Trados (založena v roce 1984) byla v roce 2005 prodána společnosti SDL se sídlem ve Velké Británii.

Na základě dosud získaných poznatků se zdá, že dnešní „hybridní“ jazykové technologie zahrnující hloubkové zpracování i statistické metody umožní překlenout propast mezi všemi evropskými jazyky. Jak tato série Bílých knih ukazuje, členské státy v Evropě se značně liší v ochotě a připravenosti řešit jazykové otázky. Velké rozdíly jsou také v oblasti výzkumu. Čeština patří mezi „menší“ jazyky EU, a proto je zapotřebí nejprve provádět další specializované výzkumy, než pro ni budou jazykové technologie skutečně účinné a než budou moci sloužit pro každodenní použití. Dlouhodobým cílem projektu META-NET je představit kvalitní jazykové technologie pro všechny jazyky v EU. Tyto technologie pomohou evropským jazykům překonat dosavadní bariéry a navázat vzájemné spojení. To vyžaduje, aby všechny zúčastněné strany – v politice, výzkumu, podnikání i společnosti – spojily v budoucnosti své síly. Tento dokument doplňuje řadu dalších činností projektu META-NET (viz příloha). Aktuální informace, např. aktuální verzi plánů projektu META-NET nebo strategický plán výzkumu (SRA), najdete na webových stránkách http://www.meta-net.eu.