Um modelo de inteligência artificial (IA) de aprendizado profundo pode prever palavras, fragmentos e sentenças ausentes em tabuletas cuneiformes com até 4500 anos.
Tábuas de barro gravadas com texto cuneiforme na língua acadiana são ferramentas fundamentais para entender as culturas que existiam na Mesopotâmia (mais ou menos a área do atual Iraque) entre 2500 aC e 100 dC Muitas dessas tabuinhas datam da época, estão danificados e carecem de seções-chave do texto Gabriel Stanovsky A Universidade Hebraica de Jerusalém e colegas de diferentes departamentos colaboraram para usar a inteligência artificial e desvendar os segredos dessas placas, completando o texto cuneiforme que faltava.
O que é escrita cuneiforme
A escrita cuneiforme é um sistema de escrita usado na antiga Mesopotâmia. É considerada a forma de escrita mais antiga do mundo e tem sido usada há mais de 3.000 anos. A escrita cuneiforme é composta por pequenos sinais em forma de cunha que foram inscritos em tábuas de barro molhado.

Codifique tabelas em escrita cuneiforme
No passado, a pesquisa já "lia" documentos antigos (cartas do renascimentoum rolos de herculano), mas nunca com esse tipo de abordagem dos escritos da civilização suméria.
A equipe usou um modelo de IA de aprendizado profundo já treinado em 104 idiomas diferentes. Estes incluem algumas línguas semíticas, como o hebraico, que compartilha semelhanças com o acadiano. Eles então treinaram o algoritmo transcrevendo 10.000 tabletes em escrita cuneiforme. O modelo de IA foi capaz de sugerir palavras e frases contextualmente precisas para preencher as lacunas. Considere como uma espécie de T9, mas com mesopotâmia.
Como sabemos se as sugestões são relevantes? Os pesquisadores também testaram IA em partes já conhecidas dos comprimidos, e a conclusão também foi excelente. A inteligência artificial reconstruiu frases na escrita cuneiforme com incrível precisão de 89%, em alguns casos até ampliando as possíveis interpretações dos textos.

A importância de conhecer línguas
“A principal descoberta deste estudo”, diz Stanovsky, “é que o uso de outras línguas realmente ajudou a codificar o acadiano”. De fato, sem pré-treinar o modelo nesses 104 idiomas diferentes, a precisão da leitura das tabuinhas cuneiformes era quase 30 pontos percentuais menor.
É uma ferramenta que, tenho certeza, liberará um enorme potencial para a decifração de importantes documentos históricos nos próximos anos.
Referências: arxiv.org/abs/2109.04513