Personal tools
A Network of Excellence forging the
Multilingual Europe Technology Alliance

META-NET White Paper Series: Press Release

Cerca de 21 línguas europeias estão ameaçadas de extinção digital

Um estudo europeu realizado por um conjunto de especialistas em Tecnologia da Linguagem adverte: é improvável a sobrevivência da maioria das línguas europeias face à Era Digital

De acordo com um recente estudo realizado por um grupo de especialistas europeus da Tecnologia da Linguagem, a maioria das línguas europeias enfrenta o risco da sua extinção digital.

Este estudo avaliou o nível de desenvolvimento tecnológico de 30 das cerca de 80 línguas europeias existentes e os investigadores concluíram que, o suporte digital em 21 delas é, na melhor das hipóteses, “inexistente” ou “fraco”. Este estudo foi realizado pela META-NET, uma rede europeia de excelência, composta por 60 centros de pesquisa em 34 países.

O estudo, elaborado por mais de 200 especialistas e documentado numa coleção de 30 volumes de Livros Brancos da META-NET, impressos e disponíveis online, fez a avaliação do desenvolvimento tecnológico de cada uma das línguas em quatro áreas diferentes: tradução automática, a interação de voz, análise de texto e disponibilidade de recursos linguísticos.

De acordo com os especialistas envolvidos, num total de 21 das 30 línguas analisadas (70%) foram classificadas na categoria mais baixa por apresentarem um “apoio fraco ou inexistente” em pelo menos, uma das áreas. Várias línguas como as da Islândia, Letónia, Lituânia e Malta, receberam a classificação mais baixa nas quatro áreas. Na outra extremidade do espectro, nenhuma das línguas foi considerada como tendo "um excelente apoio", apenas o inglês foi avaliado como tendo "um bom apoio", seguido de línguas como o holandês, o francês, o alemão, o italiano e o espanhol, com "apoio moderado". Por outro lado, existe ainda um conjunto de línguas como o basco, o búlgaro, o catalão, o grego, o húngaro e o polaco que, com um "apoio fragmentário", integram o grupo de línguas de alto risco.

"Os resultados do nosso estudo são muito alarmantes. A maioria das línguas europeias têm pouco apoio e poucos recursos e algumas são quase totalmente negligenciadas. Neste sentido, muitas das nossas línguas ainda não são à prova de futuro. ", Diz o professor Hans Uszkoreit, coordenador da META-NET, diretor científico DFKI (Centro Alemão de Pesquisa para Inteligência Artificial) e coeditor do estudo. Outro dos coeditores do estudo, Dr. Georg Rehm (DFKI), acrescenta: "Há diferenças dramáticas de apoio e desenvolvimento da Tecnologia da Linguagem entre as várias línguas europeias e áreas tecnológicas. O hiato entre línguas "grandes" e "pequenas" continua a aumentar. Temos de garantir que podemos equipar todas as línguas mais pequenas e com menos recursos com as tecnologias de base necessárias, caso contrário, estas línguas estão condenadas à extinção digital. "

A Tecnologia da Linguagem produz software que permite processar linguagem humana falada ou escrita. Exemplos bem conhecidos de software da Tecnologia da Linguagem incluem a verificação ortográfica e gramatical, os assistentes pessoais interativos em smartphones (como o Siri no iPhone), os sistemas de diálogo que trabalham por telefone, os sistemas de tradução automática, os motores de busca da web e as vozes sintéticas usadas nos sistemas de navegação automóvel. Hoje em dia, os sistemas da Tecnologia da Linguagem baseiam-se principalmente em métodos estatísticos e, por isso, requerem quantidades incrivelmente grandes de dados escritos ou falados. Nas línguas com poucos falantes é especialmente difícil adquirir o volume necessário de dados. Além disso, estes sistemas estatísticos da Tecnologia da Linguagem têm ainda limites inerentes à sua qualidade, como por exemplo aqueles que encontramos, nas traduções muitas vezes cómicas e incorretas produzidas por sistemas de tradução online das máquinas.

A Europa conseguiu eliminar quase todas as fronteiras entre os seus países. Perdura ainda uma fronteira que parece ser impenetrável: a fronteira invisível das barreiras linguísticas que impede o livre fluxo de conhecimento e informação. Esta fronteira também bloqueia o objetivo de longo prazo da criação de um mercado único digital, porque dificulta a livre circulação de bens, produtos e serviços. Embora a Tecnologia da Linguagem tenha potencial para se livrar das barreiras linguísticas através de sistemas modernos de tradução por máquina, os resultados do estudo da META-NET mostram claramente que muitas das línguas europeias ainda não estão prontas. Há lacunas tecnológicas significativas devido à focalização na língua inglesa a mais R&D, à falta de compromisso e recursos financeiros, e também à falta de uma investigação estratégica e uma visão tecnológica.

Na Europa terá de ser feita a coordenação de um esforço em larga escala para criar as tecnologias inexistentes, bem como, a transferência tecnológica para a maioria das línguas. São fortes as razões para abordar este desafio imenso como um esforço comum envolvendo a União Europeia, os seus Estados-membros e países associados, bem como a indústria. Essas razões incluem o peso financeiro per capita para pequenas comunidades linguísticas que representam a necessária a transferência de tecnologias entre as línguas, a falta de interoperabilidade dos recursos, de ferramentas e serviços, e o facto de as fronteiras linguísticas, muitas vezes não coincidirem com as fronteiras políticas. A Europa tem de tomar medidas para preparar suas línguas para a era digital. Pois elas constituem uma parte preciosa da nossa herança cultural e, como tal, merecem garantias de futuro.

Tecnologia da Linguagem: Background

A Tecnologia da Linguagem já nos apoia em tarefas cotidianas, como a escrever emails ou na compra de bilhetes. Beneficiamos da Tecnologia da Linguagem quando fazemos uma busca e traduzimos páginas da web, quando utilizamos um processador de texto com correção ortográfica e verificação gramatical, quando usamos o sistema operacional do nosso carro ou do nosso telemóvel com comandos de voz, quando recebemos indicações de uma loja de livros online, ou seguimos as instruções de voz de uma aplicação de navegação. Num futuro próximo, seremos capazes de falar com os programas de computador, bem como máquinas e equipamentos, incluindo os tão esperados robôs que em breve entrarão nas nossas casas e locais de trabalho. Onde quer que estejamos, quando precisarmos de informações ou ajuda, vamos simplesmente pedi-la, e, vamos fazê-lo em voz alta. Remover as barreiras de comunicação entre as pessoas e tecnologia vai mudar o nosso mundo.

A Tecnologia da Linguagem é reconhecida hoje em dia como uma das principais áreas de crescimento das tecnologias da informação. Grandes corporações internacionais, como a Google, a Microsoft, a IBM e a Nuance investiram consideravelmente nesta área. Na Europa, centenas de pequenas e médias empresas especializaram-se em determinadas aplicações ou serviços da Tecnologia da Linguagem. Esta área tecnológica permite às pessoas colaborarem, aprenderem, fazerem negócios e partilharem informação através das fronteiras da língua, e independentemente dos seus conhecimentos de informática.

A coleção de Livros Brancos da META-NET

A coleção de Livros Brancos da META-NET, "As Línguas na União Europeia da Sociedade da Informação", é um relatório sobre o estado atual de 30 línguas europeias âmbito da Tecnologia da Linguagem que salienta os riscos mais urgentes e as oportunidades. Esta coleção de Livros Brancos abrange todas as línguas oficiais da UE e dos Estados-Membros e diversas outras línguas faladas na Europa. Embora já tenham sido feitos diversos estudos científicos relevantes e abrangentes sobre vários aspetos das línguas e da tecnologia, até agora não houve nenhuma publicação que apresentasse os principais resultados e desafios para cada uma das línguas no que respeita a uma Europa multilingue tecnologicamente suportada. Os Livros Brancos da META-NET vêm preencher esta lacuna. Assim, a META-NET pode salientar por que motivo a maioria das línguas enfrenta sérios problemas e também identificar as lacunas mais ameaçadoras. No total, mais de 200 autores e colaboradores ajudaram a preparar os documentos dos Livros Brancos.

Os Livros Brancos foram escritos para as seguintes línguas europeias: basco, búlgaro, catalão, croata, checo, dinamarquês, holandês, inglês, estónio, finlandês, francês, galego, alemão, grego, húngaro, islandês, irlandês, italiano, letão, lituano, maltês, norueguês (bokmål e nynorsk), polaco, português, romeno, sérvio, eslovaco, esloveno, espanhol e sueco. Cada Livro Branco está escrito na língua que analisa e inclui uma tradução completa em inglês.

Sobre a META-NET e a META

A META-NET é uma rede de excelência, constituída por 60 centros de pesquisa de 34 países, com o objetivo de assegurar as bases tecnológicas de uma sociedade da informação multilíngue na Europa. A META-NET é cofinanciada pela Comissão Europeia através de um total de quatro projetos.

A META-NET está a alicerçar a META, a Multilingual Europe Technology Alliance. Mais de 600 organizações de 55 países, incluindo centros de investigação, universidades, pequenas e médias empresas, bem como várias empresas grandes, já aderiram esta aliança de tecnologia aberta.