sexta-feira, 4 de novembro de 2011

Estatística desvenda manuscrito codificado

Manuscrito no final de século 18 é decifrado

Nova York-  Uma equipe de linguistas suecos e americanos aplicou técnicas de tradução baseadas em estatística para decifrar um dos códigos mais teimosos: o Copiale Cipher, manuscrito de 105 páginas que parece datar do final do século 18. Eles descreveram seu trabalho num encontro da Associação pela Linguística Computacional em Portland, Oregon.

Descoberto num arquivo acadêmico na antiga Alemanha Oriental, o volume elaboradamente ornado com ouro e papel brocado verde abriga 75 mil caracteres, uma desconcertante mistura de símbolos misteriosos e letras romanas. O nome vem de uma das únicas inscrições não codificadas no documento.

Kevin Knight, cientista da computação do Instituto de Ciência da Informação na Universidade do Sul da Califórnia, colaborou com Beata Megyesi e Christiane Schaefer, da Universidade Uppsala, na Suécia, para decifrar as primeiras 16 páginas. Elas se mostraram uma detalhada descrição de um ritual de uma sociedade secreta que aparentemente tinha fascinação por cirurgias oculares e oftalmologia.

Tudo começou com um projeto de fim de semana neste ano, contou Knight numa entrevista, acrescentando: ''Não tenho muita experiência com criptografia. Minha formação é principalmente em linguística computacional e tradução por máquinas’'.

Incerto do idioma original, os pesquisadores percorreram diversos caminhos sem saída antes de seguir seu instinto. Primeiro, eles supuseram que os caracteres romanos continham toda a informação, e não os símbolos abstratos.

Mas quando essa abordagem fracassou, eles acharam que o código poderia ser o que os criptógrafos chamam de uma cifra homofônica – um código de substituição que não apresenta correspondência direta entre o original e as informações codificadas. E decidiram que o idioma original era provavelmente o alemão.

Mais adiante eles concluíram que as letras romanas eram os chamados valores nulos, destinados a confundir o decifrador, e que as letras representavam espaços entre palavras formadas por símbolos elaborados.

Outra descoberta crucial foi que o símbolo de dois-pontos indicava a repetição da consoante anterior.
Os pesquisadores usaram técnicas de tradução, como a frequência esperada de palavras, para adivinhar o que um símbolo poderia significar em alemão.

''Percebemos que é possível aplicar muitas dessas técnicas na decifração de códigos’', afirmou Knight.

 Fonte: Info

Nenhum comentário:

Postar um comentário