Nuevas señales de la emergencia de un idioma en el misterioso texto Voynich

Un misterioso y hermoso texto del siglo 15, que algunos investigadores estimaron recientemente que sería un galimatías, puede que después de todo no sea un engaño. Un nuevo estudio sugiere que el texto comparte características cuantificables con un lenguaje genuino, y puede contener, entonces, un mensaje codificado

Ese veredicto emerge de una técnica estadística que pone una figura en el contenido de información de los elementos en un texto o código, aún si su significado se desconoce. La técnica también se podría utilizar para determinar si hay un significado en los genomas, posibles mensajes de alienígenas, o incluso las señales entre las neuronas en el cerebro.

El manuscrito Voynich ha desconcertado y cautivado a los investigadores desde que el librero Wilfred Voynich lo encontró en un monasterio italiano en 1912. Contiene ilustraciones de ninfas desnudas, plantas no identificables, diagramas astrológicos y páginas y páginas de texto en un alfabeto que no pudo ser identificado.

Aunque los patrones de longitud de palabras y las combinaciones de símbolos en el texto son similares a las lenguas reales, varios estudios recientes han sugerido que el libro es un inteligente engaño del siglo 15 diseñado para convencer a los coleccionistas de libros del Renacimiento, y que las palabras no tienen significado. Un estudio demostró que las técnicas conocidas por los criptógrafos del siglo 16 habrían permitido que alguien creara estos patrones utilizando un conjunto de caracteres sin sentido. Otro estudio concluyó que las propiedades estadísticas de la secuencia de comandos son consistentes con un galimatías.

Entropía de las palabras

Ahora Marcelo Montemurro, de la Universidad de Manchester en el Reino Unido, y sus colegas, han analizado el texto mediante una técnica que extrae los términos más significativos. «Decidimos que es ideal para utilizar en este misterioso manuscrito», dice Montemurro. «La gente ha estado discutiendo y discutiendo durante décadas si se trata de un engaño. Este sería un nuevo enfoque.»

Sus resultados apoyan la idea de que el texto Voynich realmente contiene un mensaje secreto.

En lugar de buscar patrones en las palabras mismas, el método de Montemurro busca patrones más globales en la frecuencia y la agrupación de las palabras, que pueden indicar el significado. «Los resultados que obtenemos mirando estas cosas arrojan una nueva luz sobre el contenido del volumen», dice Montemurro.

El método utiliza una fórmula para encontrar la entropía de cada término, una medida de con qué uniformidad está distribuido. Los investigadores determinaron la entropía de un determinado término, y lo hicieron en el texto original y en una versión codificada. La diferencia entre las dos entropías, multiplicado por la frecuencia de la palabra, nos da una medida de la cantidad de información que lleva.

El método reconoce que las palabras que son particularmente importantes van a aparecer con mayor frecuencia, así como hacer una distinción entre las palabras que aportan baja información, como «y», que es de esperar que esté distribuida uniformemente a todo lo largo, y las de alta información como «lenguaje», que sólo pueden aparecer en secciones relativas a ese tema.

Puntuación y parentesco

Ya en 2009, se aplicó el enfoque de medir la entropía en palabras significativas en textos famosos de varios idiomas. En El origen de las especies, por ejemplo, entre las 10 palabras más informativas identificadas por la fórmula están «especies», «variedades», «híbridos», «formas» y «géneros». En Moby Dick, una de las palabras más importantes, de acuerdo con la fórmula, fue «ballena».

Cuando se aplicó al Voynich, la fórmula eligió varias palabras de alta entropía que parecen ser específicas para las diferentes secciones del manuscrito.

El equipo también aplicó un análisis más profundo que deduce cuán relacionadas están las palabras desconocidas, en base a cómo se agrupan las palabras relacionadas en las lenguas conocidas. Luego usaron esta calificación de la relación para comparar diferentes secciones del manuscrito.

Encontraron que los términos de alta entropía que indican las ilustraciones del manuscrito de las secciones de farmacéutica y de hierbas del libro son más propensas a estar relacionados entre sí que con los términos de las secciones que parecer tratar acerca de la astrología, biología y recetas.

«Son los que están conectados más fuerte lingüísticamente y también a nivel de sus representaciones pictóricas; son las únicas dos secciones que tienen estas plantas», dice Montemurro. «Nuestro análisis es el primero que en realidad enlaza estas secciones sólo por su estructura lingüística.»

Grupos de palabras

La técnica también mide la forma óptima de agrupar palabras relacionadas con el fin de maximizar su valor informativo. En las novelas o en los capítulos que se refieren a un tema determinado, los grupos de términos relacionados de alta entropía tiende a ser bastante grande, conteniendo varios cientos de palabras. Por el contrario, en los libros que son simplemente una lista de citas, por ejemplo, sin una plena conexión entre sí, los grupos de palabras relacionadas —conocidos como dominios de escala— sería mucho menor.

Montemurro y sus colegas compararon los dominios de escala del manuscrito Voynich con los de los textos de longitudes similares en varios idiomas: Sobre el Origen de las Especies (en Inglés), Actas del Gran Historiador (chino), Las Confesiones de San Agustín (latín) , además de código de ordenador en el lenguaje de programación FORTRAN y secciones del ADN de la levadura.

El dominio de escala de los idiomas humanos resultó de un tamaño de entre 500 y 700 palabras, mientras que en el Fortran fue de alrededor de 300 y en la levadura es más similar a 10. Para el «voynichés» fue de alrededor de 800.

«Queríamos ver si la estructura que surgía a partir del análisis sería compatible o no con un lenguaje real», dice Montemurro. «De haber encontrado algo parecido a la levadura, entonces habría arrojado más dudas sobre la naturaleza del manuscrito Voynich. Pero teniendo en cuenta el valor que obtuvimos, les decimos que no podemos ignorar que es lenguaje.»

Los defensores de la hipótesis de un fraude aún no están convencidos. En 2004, el científico de computación Gordon Rugg , de la Universidad Keele en el Reino Unido, propuso un método de baja tecnología para que un estafador inteligente creara todo el manuscrito Voynich sin inventar primero un lenguaje secreto.

Engaño factible

El falsificador podría primero haber escrito una tabla de sílabas incomprensibles que contienen las raíces, prefijos y sufijos del voynichés, y luego cubrir la mesa con un trozo de cartón con tres agujeros, pasando por encima de la mesa para leer nuevas «palabras». Utilizando diferentes tarjetas con diferentes disposiciones de agujeros produciría texto que se veía como lenguaje, a pesar de no serlo.

«El engaño sería perfectamente factible», dice Rugg, y podría producir varias de las características que encuentra Montemurro en la distribución de las palabras en el manuscrito Voynich. «Una estructura superficial compleja no tiene que ser producida por una estructura profunda compleja. Se pueden tener procesos muy simples que producen salidas muy complejas.»

Y añade que este esfuerzo podría haber estado justificado dada la sofisticación de los coleccionistas de libros de la época, que bien podría hacer algunas pruebas lingüísticas en un texto antes de comprarlo.

Rugg también señala ese manuscrito no muestra evidencia de errores que hayan sido corregidos al ser escrito. «Si el manuscrito Voynich contiene un lenguaje real, o la persona que lo escribió no se preocupó por tener errores en el mismo, o él escribió 200 páginas sin cometer un error», dice. «Eso es poco probable.»

Montemurro ahora espera analizar otras secuencias de transporte de información que no son necesariamente idioma, tales como el ADN, o tal vez señales neuronales. Esto podría ayudar a los genetistas a centrarse en las porciones de ADN más valiosas y revelar si las diferentes partes del cerebro «hablan» entre sí en un código.

«Pero [el manuscrito Voynich] tiene una fascinación, porque por un lado, no hay conclusión», admite Rugg. «Es como si fuese la novela policíaca más interesante [de todos los tiempos], y alguien arrancó las últimas tres páginas.»

Referencia de publicación: PLoS One, DOI: 10.1371/journal.pone.0066344

Fuente: New Scientist. Aportado por Eduardo J. Carletti

Más información: