zonadecodigo.comzonadecodigo.com
BÍBLIA SAGRADA
Bíblia é usada para desenvolver tecnologias de idiomas
Aplicativos de tradução, reconhecimento e sintetização de voz já são muito bons em idiomas falados por milhões de pessoas, como inglês, francês, alemão ou português. Mas eles ainda são de pouca valia para falantes de idiomas menos difundidos justamente porque falta "massa de dados" para que os sistemas de inteligência artificial nos quais essas ferramentas são baseadas obtenham o treinamento necessário.
"Quando desenvolvemos sistemas de tradução automática e motores de busca, normalmente inserimos no computador enormes quantidades de textos anotados manualmente que contêm informações sobre a função e o significado das palavras individuais.

"Por razões históricas, esses textos têm sido principalmente artigos de jornal em inglês e outras grandes línguas. Nós não temos acesso a textos anotados em línguas menores, como feroesa [Ilhas Faroé], galês, galego e irlandês, ou mesmo uma grande língua africana como o iorubá, que é falada por 28 milhões de pessoas," explica o professor Anders Sogaard, da Universidade de Copenhague, na Dinamarca.

Sabedoria bíblica

Mas artigos de jornal não são a única fonte possível de informação sobre palavras e expressões em um determinado idioma. Há um livro grande, o mais traduzido em todo o mundo e, provavelmente, também o mais comentado: a Bíblia.

"A Bíblia foi traduzida em mais de 1.500 idiomas, mesmo os menores e mais 'exóticos', e as traduções são extremamente conservadoras: os versículos têm uma estrutura completamente uniforme ao longo de muitas línguas diferentes, o que significa que nós podemos construir modelos de computador adequados mesmo dos menores idiomas, dos quais nós temos apenas algumas centenas de páginas de texto bíblico," disse Sogaard.

Agora a equipe apresentou os primeiros resultados de seu "esforço bíblico".

"O esforço está valendo a pena, já tendo servido para construir modelos de mais de 100 idiomas 'exóticos', como suaíli, uólofe e xhosa, que são falados na Nigéria [e em outros países africanos]. Isto significa que poderemos desenvolver tecnologias de linguagem para esses idiomas similares às disponíveis para os falantes de inglês ou francês," disse o pesquisador.

O trabalho da equipe não tem data para terminar, e o esforço de criação de novas ferramentas - do tipo de aplicativos como Siri e Google Translate - para idiomas menos falados continuará.

Bibliografia:

If all you have is a bit of the Bible: Learning POS taggers for truly low-resource languages
Zeljko Agic, Dirk Hovy, Anders Sogaard
Proceedings of the National Academy of Sciences
Vol.: To be published
Comentar artigo



Esta fibra óptica deveria pagar royalties a Einstein

IBM lançará computador quântico comercial

Armazenamento na "névoa" elimina os riscos do armazenamento na "nuvem"

Construção de computador quântico é radicalmente simplificada

Depois da Inteligência Artificial, vem aí a Inteligência Paralela

Computador de DNA consegue identificar doenças

Chips de memória viram processadores com computação ternária

Como fazer softwares com menos bugs

Primeiros ensaios de games estilo Matrix: console é o cérebro.

SpaceX quer lançar mais satélites do que já existe em órbita

Detectada estranha propriedade quântica do espaço interestelar

Nasce um novo tipo de computador

Linguagem de programação para computadores com energia intermitente

Primeira tela holográfica realística, com 3D em 360º

As vacâncias de nitrogênio, defeitos em escala atômica no interior dos diamantes, vêm sendo usadas como qubits de computadores quânticos há algum tempo.

Memória neuromórfica TRAM para cérebros eletrônicos

Como a Inteligência Artificial afetará vida urbana em 2030

Hardware substitui software e dobra velocidade de processadores

Luz ambiente enxerga tudo o que você faz

Dinheiro de plástico: a derrocada dos incautos

Uma "varinha mágica" digital promete melhorar a segurança no acesso a redes sem fio.

México torna-se pioneiro em internet por luz

Ao invés de entretenimento, a Microsoft está interessada em levar o escritório para os carros, para a alegria de quem trabalha em movimento

Ao invés de entretenimento, a Microsoft está interessada em levar o escritório para os carros, para a alegria de quem trabalha em movimento

Interação física com a realidade virtual

Óculos de realidade virtual sem dor de cabeça e sem enjoo

O memcomputador faz componentes eletrônicos que conseguem guardar dados e podem ser usados para cálculos, tudo simultaneamente.

Chip implantado na pele monitora glicose e colesterol

Dois estudantes do MIT Media Lab criaram uma interface pessoal que transforma a unha do usuário em um touchpad sem fio.

Ela é capaz de capturar 25 imagens em sequência, com intervalos na casa dos femtossegundos

Teclado reconhece o usuário pelo estilo de digitação.

Carros ganham tecnologia da informação de código livre

Tatuagem eletrônica comanda celulares e computadores

Telas de enrolar é uma realidade, mas quando chegarão ao mercado?

Primeiro edifício do mundo montado à partir de uma impressora 3D

Em 30 de junho, será acrescido um segundo ao Tempo Universal Coordenado (UTC)

Físicos conseguiram manter dados quânticos gravados, acessíveis e íntegros por um tempo recorde de seis horas.

XP ainda continua sendo o 2º sistema operacional mais utilizado no mundo.

Internet banda larga em aviões integrará todas as conectividades.

Software criar ritmo musical de acordo com os movimentos