Des scientifiques ont-ils déchiffré un très vieux code en hébreu ? Pas si vite
Rechercher
"A personne d'autres qu'à leurs maîtres"

Des scientifiques ont-ils déchiffré un très vieux code en hébreu ? Pas si vite

Le manuscrit de Voynich est source de fascination auprès des universitaires depuis le 15e siècle

Amanda Borschel-Dan édite la rubrique « Le Monde Juif »

Pages extraites de MS 408 de Neinecke, ou manuscrit de Voynich. (Crédit : bibliothèque des livres et manuscrits rares Beinecke)
Pages extraites de MS 408 de Neinecke, ou manuscrit de Voynich. (Crédit : bibliothèque des livres et manuscrits rares Beinecke)

Des scientifiques canadiens affirment avoir déchiffré le manuscrit de Voynich, vieux de plusieurs siècles. En utilisant des outils d’intelligence artificielle, des algorithmes sophistiqués et avec – un petit peu – d’aide de Google Translate, des chercheurs de l’université d’Alberta ont émis l’hypothèse que ce long texte – très – difficile à appréhender serait écrit en hébreu codé.

Dans leur article intitulé Déchiffrage de texte en anagramme écrit dans une langue et une écriture inconnues, Grzegorz Kondrak, professeur de l’université d’Alberta, et Bradley Hauer, étudiant en doctorat, ont précisé la méthodologie qu’ils ont utilisée pour décoder des textes codés tels que le mystérieux manuscrit de Voynich.

Ce volume de 240 pages illustré et relié en vélin est désormais conservé à la bibliothèque des livres et manuscrits rares Beinecke de l’université américaine de Yale.

Pendant des siècles, le sens de ce manuscrit unique composé de longs textes et de dessins ésotériques de flore, de faune, du cosmos et un grand nombre d’images de femmes nues – a complètement échappé aux spécialistes.

Interrogé sur la raison de sa fascination pour le manuscrit de Voynich, Kondrak a répondu au Times of Israel : « C’est comme demander pourquoi les gens veulent tenter de grimper le mont Everest. Les gens adorent résoudre des énigmes et faire des choses que d’autres n’ont pas été capables de faire ».

Lisa Fagin Davis, directrice de l’Académie médiévale d’Amérique, lisant le manuscrit en 2016. (Crédit : Raymond Clemens, bibliothèque des livres et manuscrits rares Beinecke)

Le mystère du manuscrit de Voynich aura mené à des douzaines de tentatives de déchiffrage du code utilisé, notamment de la part d’une équipe de cryptographes de Bletchley Park, au Royaume-Uni, la même équipe qui avait trouvé les codes de la machine Enigma des nazis.

Il a également donné naissance à un genre entier avec des centaines d’ouvrages de fiction, un octet musical a cappella étrangement composé, écrit par Stephen Gorbo, diplômé de l’école de musique de Yale, un jeu de mémoire en ligne utilisant des illustrations choisies et une bande-dessinée « Marvel Adventures: Black Widow and The Avengers, #18 », qui contient une scène où le manuscrit disparaît à l’université de Yale.

La presse internationale a récemment annoncé la publication d’une nouvelle théorie qui pourrait expliquer l’origine du puzzle caractérisé par ce manuscrit. Elle a été présentée au monde par des laboratoires de l’université qui auraient développé un logiciel susceptible de battre des joueurs professionnels du Texas hold ’em poker.

« Marvel Adventures: Black Widow and The Avengers, #18 » , de Paul Tobin et Ig Guara qui présente la bibliothèque des livres et manuscrits rares de Beinecke et le Beinecke MS 408 (le Manuscrit de Voynich)

Mais malgré tout ce battage médiatique, les premiers résultats semblent moins impressionants que prévus. Les traductions par informatique proposées par Kondrak et Hauer n’ont permis de mettre à jour que quelques mots en hébreu comme « fermier », « lumière », « air et « feu » et une seule phrase, que l’on attendait depuis longtemps, a été traduite : « Elle a fait des recommandations au prêtre, homme de la maison et à moi et au peuple ».

Comme l’ont noté les auteurs dans leur article, « pour un locuteur natif de cette langue, il ne s’agit pas vraiment d’une phrase cohérente ».

Le Times of Israel s’est entretenu avec des spécialistes de l’hébreu, de l’informatique et du Moyen-Age qui ont analysé cette découverte.

Une fascination durable pour le manuscrit de Voynich

Dans les entrailles du British Museum, il y a un rayon consacré au collectionneur de livres anciens Wilfred Voynich. Il s’est fait remarquer en vendant à l’institution une collection de 150 ouvrages « uniques », qui sont actuellement les seules copies connues de ces livres.

Rien d’étonnant donc que Voynich soit celui qui a redécouvert la seule copie existante de ce manuscrit qui porte depuis son nom. Il a été trouvé alors que ce libraire procédait à l’achat – un peu suspect – d’un lot de 20 à 30 livres dans un collège jésuite italien en 1912.

Selon René Zandbergen, passionné par le manuscrit de Voynich et créateur d’un site internet fourni qui détaille les tenants et les aboutissants de ses recherches, « le secret qui entoure la vente provient du fait que les traces d’appartenance du manuscrit aux Jésuites ont été éliminées du livre, comme on peut clairement le constater dans les scanners numériques modernes qui ont été réalisés ».

Avec ses origines ancrées dans l’incertitude, le manuscrit de Voynich est considéré comme un canular complexe par certains et une source de connaissances par d’autres. Son auteur est inconnu, ce qui a entraîné des spéculations – des théoriciens avançant l’hypothèse d’un Egyptien obsédé par le sexe, des sorcières iraniennes, des extra-terresres ou encore Leonard de Vinci. Certains sont allés même jusqu’à soupçonner un ancien pharmacien né en Pologne et formé à Moscou d’avoir rédigé l’ouvrage – le libraire polyglotte Voynich lui-même.

Une image non-datée du collectionneur et libraire passionné de livres anciens Wilfred Voynich, un ancien révolutionnaire polonais qui aurait su parler 18 langues (Crédit : Domaine public).

La citation la plus ancienne connue du manuscrit se trouve dans une lettre qui daterait environ de 1665 et qui décrit un achat antérieur (pour une valeur de 600 ducats d’or) par l’empereur de Habsbourg, Rudolph II (1576–1612). Rudolph aurait apparemment donné le livre à son médecin, Jacobus Sinapius, et il aurait ensuite été remis à un alchimiste de Prague, Georg Baresch.

Vers 1665, l’héritier de Baresch, Joannes Marcus Marci, aurait donné le livre au célèbre érudit jésuite Athanasius Kircher, accompagné d’une lettre exprimant sa frustration : « De tels sphinx n’obéissent à personne d’autre qu’à leurs maîtres ».

Le dernier propriétaire connu de l’ouvrage a été Voynich, qui l’aurait acquis en 1912 mais ne l’a présenté au grand public qu’en 1915.

Le volume est écrit dans un script inconnu et dans une langue inconnue. Il semble être divisé en sections qui sont regroupées en fonction de illustrations. Dans les sections consacrées aux plantes et à la pharmacie, un grand nombre des dessins dépeignent des herbes que les spécialistes ne parviennent pas à identifier. Les sections astronomique et anatomique comprennent des configurations géométriques indéchiffrables. Et il y a également des dessins anatomiques – avec une majorité de figures féminines nues, évoluant parfois dans des tubes fantastiques.

Une « illustration » anatomique extraite de Beinecke MS 408, le manuscrit de Voynich Crédit : bibliothèque des livres et manuscrits rares Beinecke)

On pense que ce parchemin en peau de veau de 22,5 centimètres de hauteur sur 16 centimètres de largeur contenait à l’origine 116 feuilles numérotées, dont 14 manquent dorénavant. Il y a plusieurs encarts de différentes dimensions parmi ses pages qui contiennent de grandes illustrations saisissantes. Le texte consiste en une écriture de gauche à droite, écrite d’une main nette – ou bien par de multiples mains – avec des mots bien espacés et des phrases divisées en paragraphes.

La docteure Lisa Fagin Davis, directrice de l’Académie médiévale d’Amérique, a obtenu son doctorat à l’Université de Yale et elle a travaillé pendant des années sur le manuscrit de Voynich. Elle a présenté le texte dans un blog très populaire, indiquant qu’il a été rédigé avec des lettres antiques distinctes, dont certaines semblent montrer une majusculisation.

« Il n’y a ni rayures, ni correction et chaque graphème est toujours écrit en utilisant le même ductus – ou séquence de touche de stylo. Les ligatures entre les couples graphémiques particuliers sont constantes et régulières. Cela suggère que le code a été écrit par des scribes qui avaient rédigé le manuscrit auparavant ou qui en copiaient un exemplaire », a expliqué Fagin Davis sur son blog.

En 2009, le parchemin a subi un processus de datage au radiocarbone à l’université de l’Arizona. Les scientifiques ont pris quatre échantillons du code et ont fait remonter le manuscrit – avec 95 % de certitude – aux années 1404-1438.

Plus tard, les pigments d’encre et de peinture ont été analysés par des tests médico-légaux à l’université de Yale, en 2014. Cette analyse a révélé qu’il n’y avait nulle trace de présence d’ingrédients modernes et que ceux qui ont été détectés étaient disponibles dès le Moyen-Age, selon le site de Zandbergen, qui a ajouté que « malgré certaines suggestions du contraire, tous ces matériaux étaient utilisés en Europe ».

L’illustration d’un encart de la page 88v du MS 408 de Beinicke, le manuscrit de Voynich

Il y a quelques exemples de langage « non codé » dans l’ouvrage, écrits en lettres latines. Par exemple, le mot « rot », qui veut dire « rouge » en allemand, a été découvert écrit à l’intérieur d’une illustration de plante durant un processus d’analyse par imagerie à haute-résolution.

Selon Zandbergen, « une comparaison avec une autre plante du 15e siècle, à savoir la MS 362 de la Biblioteca Civica Bertoliana’ à Vicenza (une plante faisant partie de ce qu’on a appelé les « plantes alchimiques ») rend plausible le fait qu’il s’agisse d’annotations de couleur et que la langue natale de l’auteur du manuscrit de Voynich ait été l’allemand ». Mais cela, a-t-il admis, n’est qu’une spéculation.

Après des décennies d’analyse, il s’avère que le manuscrit de Vyonich est véritablement unique.

Aussi loin que remontent les manuscrits médiévaux, il n’y a rien de comparable au Voynich

« Aussi loin que remontent les manuscrits médiévaux, il n’y a rien de comparable au Voynich », a dit Fagin Davis au Times of Israel. Elle a été « fascinée » par le manuscrit dès qu’elle en a entendu parler lors de son cours d’introduction à la paléographie latine à la bibliothèque de Yale, en 1988.

« L’idée d’un manuscrit qu’on ne réussit pas à lire et qui est illustré par des images qui défient l’interprétation est assez fascinante. Ajoutez à cela que l’histoire du manuscrit et les preuves scientifiques qui démontrent qu’il a été finalement rédigé au début du 15e siècle viennent se mélanger à des douzaines, sinon des centaines, de propositions de théories et de traductions, chacune plus bizarre et fantastique que l’autre, et vous obtenez un objet qui est véritablement irrésistible », a-t-elle dit.

Lorsqu’elle était à Yale, Fagin Davis a travaillé comme assistante du conservateur des manuscrits d’avant l’an 1600. Elle a été en charge des courriers liés à Voynich pendant plusieurs années, répondant aux requêtes d’images. Elle a également correspondu avec d’innombrables aspirants déchiffreurs de code.

Fagin Davis, qui conserve une copie du manuscrit en PDF sur son ordinateur, explique qu’elle s’intéresse actuellement à la manière dont ce document unique a su capturer l’imagination populaire.

« Je collectionne les ouvrages éphémères liés à Voynich, comme des romans ou autres, et je me retrouve à ré-examiner des solutions possibles très régulièrement », dit-elle. Certaines de ces « solutions », a-t-elle noté, ont été générées par le biais de l’intelligence artificielle.

Détails pratiques de l’étude d’Alberta

La conclusion de l’article rédigé par Hauer et Kondrak – que le manuscrit serait écrit en hébreu codé – est-elle possible ?

Dans leur article, les spécialistes de l’informatique de l’université d’Alberta décrivent le manuscrit de Voynich comme le « plus stimulant des problèmes de décryptage ».

Une illustration du MS 408 de Beinecke ou le manuscrit de Voynich. (Crédit : bibliothèque des livres et manuscrits rares Beinecke)

« Inspirés par le mystère du manuscrit de Vyonich et par des écritures anciennes jamais déchiffrées, nous avons développé une série d’algorithmes dans le but de décoder des scripts alphabétiques inconnus mettant en exergue des langues inconnues », ont écrit Hauer et Kondrak.

Les scientifiques ont basé leur étude sur 43 pages du manuscrit contenant 17 597 mots et 95 465 caractères qui ont été transcrits en 35 caractères issus de l’alphabet Courrier – l’une des tentatives de translittération systématique semi-acceptée de l’écriture utilisée par Vyonich.

Observant les fréquences relatives des symboles, les scientifiques ont voulu les classer en fonction de leur fréquence d’apparition puis ils ont souhaité « normaliser » ces fréquences pour illustrer une distribution probable. Cette normalisation a alors été mise en parallèle avec la fréquence et la distribution des lettres parmi une gamme de presque 400 langages candidats.

Le déchiffrage, écrivent-ils dans leur article, s’est effectué avec un algorithme merveilleusement nommé, « l’algorithme glouton à échange rapide ». Il a permis aux scientifiques de changer l’ordre des mots et des lettres jusqu’à l’obtention d’un résultat plus logique.

Ils ont alors utilisé trois systèmes pour identifier le langage du texte : la méthode de fréquence des lettres, la méthode de modèle par décomposition et la méthode de déchiffrage par essai. Deux sur trois ont classé l’hébreu (et d’autres langues sémites) en tête. La troisième méthode a mis en avant la langue mazatec, parlée dans le sud du Mexique. De manière surprenante, dans la méthode de déchiffrage par essai, l’espéranto – conçu par l’homme – a également figuré à une très bonne place.

Une illustration astronomique typique trouvée dans le MS 408 de Beinecke, ou manuscrit de Voynich. (Crédit : bibliothèque des livres et manuscrits rares Beinecke)

Selon les auteurs, s’il n’y a pas un parfait accord entre les trois méthodes concernant la source de la langue sous-jacente la plus probable, les données statistiques indiquent l’hébreu dans deux des méthodes les plus précises.

« L’hébreu est une candidate plausible au niveau historique, car elle était largement utilisée au Moyen-Age. En fait, un certain nombre de techniques d’encodage, notamment l’anagramme, peuvent remontrer à l’ère de la cabale juive », selon eux.

La cabale, ou mysticisme juif, s’est développée aux alentours du 12e et du 13e siècle dans le sud de l’Europe, notamment en Espagne et en Italie. Et on se demande donc si le manuscrit aurait pu être une sorte de cryptographie pour la population croissante de crypto-Juifs à l’époque qui aura précédé l’expulsion espagnole de 1492.

Les preuves ne le confirment pas.

Une recherche prometteuse mais pas pour Voynich

Shlomo Engelson Argamon, professeur en sciences informatiques et directeur du Master de programme en sciences des données à l’Institut de technologies de l’Illinois, a expliqué l’étude canadienne en termes profanes au Times of Israel.

Parmi ses domaines d’intérêt, Argamon recherche des méthodes informatiques d’analyse basées sur le style du langage naturel en utilisant l’apprentissage automatique et en explorant les applications de l’analyse de renseignement et la linguistique médico-légale. Il a expliqué que dans l’ensemble, la méthodologie et l’évaluation du travail réalisé par les scientifiques canadiens sont « intéressantes ».

Le professeur de sciences informatiques de l’Institut de technologie de l’Illinois Shlomo Argamon (Crédit : Institut de technologie de l’Illinois )

« Le nouvel algorithme créé par l’équipe semble très bon pour des problèmes modernes, comme le déchiffrage des codes mais, dans son application au manuscrit de Vyonich, cela devient bien plus spéculatif », a déclaré Argamon.

L’application au manuscrit de Voynich est basée sur le postulat que la personne qui l’avait écrit l’avait encodé en substituant des lettres les unes aux autres et en mélangeant leur ordre comme dans une anagramme. Les scientifiques « présument que cela a été le processus utilisé mais nous ne savons pas si c’est vrai ou non », a expliqué Argamon.

Un autre problème est que l’algorithme est « seulement basé sur la statistique des lettres » – comme la fréquence de la lettre ou un double lettrage dans un mot – « et il ne s’intéresse pas à la grammaire ni aux problèmes basés sur le langage », a ajouté Argamon, qui parle hébreu lui-même et qui a obtenu une bourse post-doctorale Fulbright à l’université de Bar-Ilan (1994-1996) et la Bourse de la Fondation des Immigrants Scientifiques en Israël (1999-2002).

L’algorithme des scientifiques, a-t-il poursuivi, juxtapose le texte avec d’autres langues. Sur les langues disponibles testées, c’est l’hébreu qui a obtenu la plus haute note.

« Une langue devait forcément se trouver à la première place, mais est-ce significatif ? Il pourrait y avoir d’autres langues qui ne se trouvent pas dans le mélange et qui pourraient obtenir une note encore bien plus élevée », a estimé Argamon. « Les scientifiques disent que la langue utilisée ressemble plus à l’hébreu qu’à d’autres. Selon moi, cela ne veut pas dire grand chose ».

Une image astronomique de deux pages typique extraite de MS 408 de Neinecke, ou manuscrit de Voynich. (Crédit : bibliothèque des livres et manuscrits rares Beinecke)

De la même manière, a dit Argamon, lorsque le texte a été décodé en hébreu, « le fait qu’on puisse réarranger les lettres de la manière que l’on veut laisse beaucoup de marge par rapport à ce qu’on entend par ‘bon hébreu’. La technique glouton à échange rapide permet un réarrangement ad-hoc de l’ordre des lettres et des mots ».

« S’ils devaient utiliser les échanges de lettres et l’ordre des mots dans d’autres langues, je présume qu’ils pourraient trouver des phrases quasiment complètes dans d’autres langues également », dit-il.

Enfin, Argamon a abordé la question de l’utilisation de Google Translate. « Cela vous donnera une réponse pour presque tout : Si vous tapez la lettre ‘A’ 17 fois, Google Translate va vous donner quelque chose qui peut ressembler à une phrase si vous voulez vraiment y croire », a-t-il continué.

« Si vous tapez la lettre ‘A’ 17 fois, Google Translate va vous donner quelque chose qui peut ressembler à une phrase si vous voulez vraiment y croire »

Fagin Davis a ajouté aux inquiétudes nourries par Argamon un autre problème : Il semblerait que Google Translate travaille avec de l’hébreu moderne et non médiéval.

« Si le manuscrit part d’un code en hébreu, il code un hébreu du 15e siècle, pas cet hébreu moderne avec lequel travaille l’algorithme de Google translation », a-t-elle dit.

Pour tester les capacités de l’outil de traduction, Fagin Davis a pris un échantillon d’une retranscription en alphabet romain du manuscrit ce qui, a-t-elle expliqué, se fait de manière assez habituelle, en utilisant un système de substitution appelé l’alphabet européen de Vyonich. Elle a ensuite demandé à Google Translate d’identifier la langue et de traduire l’extrait en anglais.

« L’algorithme a identifié le langage comme étant de l’Hindi traduit et m’a donné une traduction qui est presque compréhensible. Je ne suggère certainement pas que le manuscrit est codé en Hindi (même si quelqu’un, quelque part, l’a certainement supposé), mais je pense que dépendre de Google Translate est certainement problématique et affaiblit les arguments avancés par les scientifiques », a estimé Fagin Davis.

Publié trop rapidement ?

De nombreux universitaires ne comprennent pas pourquoi les Canadiens n’ont pas fait appel à un linguiste spécialisé en hébreu pour appuyer leurs affirmations.

Le professeur Matthew Morgenstern, chef du département du langage hébreu et de linguistique sémitique à l’université de Tel Aviv (Crédit : Hodayah Sundick-Morgenstern)

« On s’attend habituellement à ce que lorsque quelqu’un a décodé un langage, le texte produit par le déchiffrage offre une cohérence. Dans ce cas précis, le processus de ‘déchiffrage’ produit un texte sans grammaire et incohérent qui semble être composé d’une série de mots non liés les uns aux autres », a dit le professeur Matthew Morgenstern, chef du département de langue hébraïque et de linguistique sémitique à l’université de Tel Aviv.

« Les auteurs de l’étude – ils le reconnaissent eux-mêmes – ne parlent pas hébreu. Connaître la langue originale à partir de laquelle un texte a été codé apparaît comme un préalable essentiel à tout processus de déchiffrage », a expliqué Morgenstern, dont l’expertise comprend la lecture d’inscriptions et de manuscrits, notamment le décodage de texte arabes écrits en script araméen.

Dans un échange de courriels, Fagin Davis a écrit que « comme un grand nombre de chercheurs avant eux, je pense que les auteurs ont publié leurs travaux de façon prématurée. On ne peut pas crier victoire quand, d’une part, votre proposition ne peut pas être reproduite et, d’autre part, n’aboutit pas à un déchiffrage qui a du sens ».

« Un déchiffrage acceptable doit suivre des règles logiques de manière à ce que d’autres personnes puissent reproduire vos résultats et il doit donner un texte intelligible, lisible, défendable. Pour autant que je le sache, cette hypothèse ne le permet pas », a écrit Fagin Davis.

Une image astronomique de deux pages typique extraite de MS 408 de Neinecke, ou manuscrit de Voynich. (Crédit : bibliothèque des livres et manuscrits rares Beinecke)

En réponse, le professeur Kondrak de l’université d’Alberta a fait savoir au Times of Israel cette semaine que « nous n’affirmons pas avoir déchiffré le manuscrit ». De la même manière, a-t-il ajouté, « les résultats rapportés dans notre article sont complètement reproductibles. Ils ne ‘dépendent pas de Google translate’, qui est uniquement mentionné pour illustrer comment une séquence de phrase incohérente en hébreu peut être ‘traduite’ en phrase grammaticale en anglais ».

Dans la presse canadienne, Kondrak a déploré que la réception de son article par des spécialistes de Voynich ait été moins « qu’amicale ».

Pour sa part, Kondrak a expliqué être simplement motivé par le déchiffrage des écritures anciennes – et qu’il y a encore beaucoup à faire dans ce domaine.

« Des scripts anciens non déchiffrés comme le Linéaire 1 sont encore plus intéressants [que le manuscrit de Vyonich]. Le problème, c’est qu’il n’y a pas suffisamment de données pour un programme informatique. Par exemple, l’inscription la plus longue en écriture Indus connue grâce à l’archéologie contient seulement 14 symboles », a expliqué Kondrak au Times of Israel.

Interrogé sur la raison pour laquelle l’équipe n’a pas fait appel à un expert en hébreu, Kondrak a répondu : « Nous n’avons pas pu trouver un expert et cryptologue en hébreu médiéval dans notre université. Ce n’est pas simplement un texte en hébreu qu’on peut donner à n’importe qui parlant l’hébreu et en lui demandant ce que ça veut dire – c’est un déchiffrage très complexe, et dont il est difficile de tirer un sens. Maintenant que la recherche bénéficie d’une telle attention, de nombreuses personnes nous contactent pour nous aider ».

« Quelqu’un qui connaîtrait très bien l’hébreu et qui serait en même temps historien pourrait tenir compte de ces nouveaux éléments et suivre ce type d’indices », a-t-il ajouté.

« Pouvons-nous examiner ces textes de très près et faire une sorte de travail de détective pour déchiffrer quel peut bien être le message ? »

En savoir plus sur :
C’est vous qui le dites...