Talmud : L’apprentissage automatique confirme le statut unique de certains traités
Une étude montre que les "traités spéciaux" du Talmud de Babylone présentent des caractéristiques linguistiques distinctes, telles qu'elles ont été commentées par les sages médiévaux
Les commentateurs rabbiniques du Talmud avaient remarqué, déjà à l’époque médiévale, que quelques sections du corpus talmudique se distinguaient linguistiquement du reste. Des générations d’érudits ont considéré l’existence de ces « traités spéciaux » comme un indice permettant d’élucider la manière dont le Talmud a été compilé et édité.
Aujourd’hui, grâce aux méthodes modernes d’analyse des données, une équipe de chercheurs contemporains a démontré que ces « traités
spéciaux » présentent effectivement un usage distinct de la langue. Après avoir soumis la quasi-totalité du corpus talmudique à des algorithmes d’apprentissage automatique pour analyser l’araméen, ils ont confirmé les théories de Rachi et d’autres érudits médiévaux.
« Nous avons fourni la première preuve statistique complète de ce que les humains savent intuitivement depuis des siècles », a déclaré Jakub Zbrzeżny, l’un des auteurs de l’article intitulé « A computational analysis of the special Talmudic tractates », publié en avril dans The Journal of Jewish Studies.
Ce type de recherche est « une exploration de la diversité linguistique du monde juif. Elle met en lumière cette complexité. Ce n’est pas aussi simple que nous le pensons », a-t-il expliqué au Times of Israel.

L’araméen, l’ancienne langue sémitique qui était la lingua franca du Levant à l’époque du Second Temple, survit en tant que langue parlée parmi quelques locuteurs néo-araméens, en tant que langue écrite dans la liturgie de l’Église syriaque, et dans le monde juif, en grande partie grâce à son utilisation dans l’étude du Talmud. L’araméen est bien plus diversifié que la plupart des gens ne le pensent, a rappelé Zbrzeżny.
« L’araméen est un ensemble complexe de dialectes. L’araméen que parlait Jésus n’avait rien à voir avec l’araméen que parleraient les Juifs d’Irak. L’araméen des temps bibliques n’est pas l’araméen du Talmud, et l’araméen du Talmud de Babylone n’est pas l’araméen du Talmud de Jérusalem », a-t-il ajouté, faisant référence aux deux corpus talmudiques, l’un compilé en Irak et l’autre en Terre d’Israël.
Les deux Talmuds sont basés sur la Mishna, la loi orale juive, qui a été écrite en hébreu et compilée vers l’an 200 de notre ère par le rabbin Judah HaNassi. Des sections de la Mishna ont ensuite fait l’objet de débats et d’exposés dans les grandes académies rabbiniques, et les deux Talmuds ont finalement été compilés en araméen à partir de ces discussions, le Talmud de Babylone vers 500 de notre ère et le Talmud de Jérusalem peut-être une centaine d’années plus tôt.

Selon M. Zbrzeżny, le fait que « la machine » compare le langage du Talmud de Babylone et celui du Talmud de Jérusalem a permis de confirmer l’identification par les rabbins des traités spéciaux dans le Talmud de Babylone.
Tout d’abord, les chercheurs ont introduit dans la base de données une grande quantité de textes provenant des deux Talmuds, ce qui a permis à l’algorithme d’apprentissage automatique d’apprendre les deux versions de l’araméen, a-t-il expliqué.

Ensuite, ils ont donné à l’ordinateur d’autres sections d’araméen non identifiées provenant des deux Talmuds et l’algorithme a pu déterminer avec précision l’origine des textes, confirmant ainsi que le programme comprenait les différences linguistiques entre eux. Finalement, l’ensemble du corpus araméen des deux Talmuds a été saisi.
« Cependant, la machine a attribué au Talmud de Jérusalem un certain nombre de lignes que nous savions provenir du Talmud de Babylone », a déclaré Zbrzeżny. De cette manière,
« la machine vous dit que cette ligne de ce que nous savons être le Talmud de Babylone a, par exemple, une probabilité de 90 % d’appartenir au Talmud de Jérusalem ».
« Le nombre de lignes mal identifiées était très élevé pour [les sections] que les érudits désignaient intuitivement comme les ‘traités spéciaux’ », a-t-il poursuivi.
« Ceux qui ont compilé le Talmud étaient conscients de la diversité linguistique au sein du Talmud lui-même, et savaient quand certains passages sortaient du lot. Les rabbins médiévaux d’Europe ont également remarqué que certains traités se distinguaient sur le plan linguistique. »
Ces rabbins l’ont fait « simplement par intuition savante, en lisant ces textes et en repérant des passages apparemment archaïques ou une orthographe conservatrice », a ajouté Zbrzeżny.
Références à Alexandre le Grand
L’un des « traités spéciaux », le Traité Tamid, qui porte sur les sacrifices quotidiens dans le Temple, comportait un grand nombre de lignes signalées par l’algorithme, mais un membre de l’équipe, Noam Eisenstein, étudiant en maîtrise à l’université de Tel Aviv a observé que ces lignes concernaient toutes des récits sur Alexandre le Grand. Si ces lignes étaient retirées de l’équation, le traité ne comporterait que de l’araméen juif babylonien normal, ce qui pourrait indiquer que ces sections ont été compilées et ajoutées à partir d’une autre source.
Les chercheurs ont également découvert un nouveau phénomène : certains traités présentent une « uniformité dialectique évidente… une langue particulièrement uniforme dans certains traités peut indiquer soit sa rédaction spécifique, soit le travail du copiste du manuscrit », écrivent les auteurs.

Toutefois, Zbrzeżny a déclaré que les résultats de la recherche, bien que prometteurs, ne sont pas encore révolutionnaires.
« L’apprentissage automatique ne remplace pas un être humain ; il facilite notre recherche humaine. Il ne répond pas à la question de savoir quand le Talmud a été compilé ou pourquoi nous observons une telle diversité linguistique », a-t-il déclaré.
Les discussions académiques sur « les raisons pour lesquelles certains passages sont singuliers, s’ils représentent l’araméen parlé ou s’ils sont archaïques… nous n’avons pas encore la réponse ». Des recherches plus approfondies dans ce domaine peuvent contribuer aux débats académiques, oui, et la machine peut probablement repérer d’autres caractéristiques linguistiques que les chercheurs n’ont pas encore identifiées ».
Un chercheur aventureux
Zbrzeżny, né en Pologne et chargé de cours sur le judaïsme du Second Temple au département de théologie de l’université d’Aberdeen, a participé à l’étude du Talmud au cours de ses trois années de recherche post-doctorale en Israël. L’équipe était dirigée par le professeur Lee-Ad Gottlieb de l’université d’Ariel et le docteur Eshbal Ratzon de l’université de Tel Aviv, et financée par la Fondation Cogito en Suisse.
Joint par Zoom lors d’une visite de travail aux Émirats arabes unis, Zbrzeżny a rappelé qu’au cours de ses recherches post-doctorales avec des universitaires israéliens, il s’est également immergé dans l’arabe parlé local, une langue dont « la diversité des dialectes donne un bon aperçu de la manière dont l’araméen a pu fonctionner dans le passé, car les dialectes néo-araméens parlés aujourd’hui fournissent des analogies similaires ».
Cette immersion lui a permis de poursuivre un nouveau projet visant à
« approfondir notre compréhension du Tanah [Bible hébraïque] et du Nouveau Testament » à travers la langue, le dialecte et les coutumes de villages arabes isolés.
« De nombreux musulmans de Cisjordanie aiment la Bible, ils en possèdent des exemplaires, mais ne supportent pas les versions arabes modernes qui, selon eux, sont rédigées dans un langage bureaucratique ou ressemblent à un journal, explique Zbrzeżny.
En amorçant un dialogue avec les habitants et en écoutant comment ils
« traduisent » ou « interprètent » la Bible dans « leur propre dialecte
rural », il est possible d’obtenir « des informations fantastiques… nous avons des raisons de croire que ces ‘non-experts’ peuvent fournir des lectures de ces textes que les chercheurs occidentaux ne sont pas en mesure de découvrir par eux-mêmes ».
Ce processus, appelé « lecture contextualisée », est « une approche expérimentale, mais elle a le potentiel d’être très prometteuse si une méthodologie appropriée est développée », a précisé Zbrzeżny. « Il y a des passages de la Bible dont le sens reste incertain, mais [ces locaux] ont leur propre compréhension, et nous verrons s’ils donnent des indications sur le sens original qui a été perdu. Le monde des langues sémitiques, comme l’araméen et l’arabe, attend encore de nouvelles découvertes. »
... alors c’est le moment d'agir. Le Times of Israel est attaché à l’existence d’un Israël juif et démocratique, et le journalisme indépendant est l’une des meilleures garanties de ces valeurs démocratiques. Si, pour vous aussi, ces valeurs ont de l’importance, alors aidez-nous en rejoignant la communauté du Times of Israël.

Nous sommes ravis que vous ayez lu X articles du Times of Israël le mois dernier.
C'est pour cette raison que nous avons créé le Times of Israel, il y a de cela onze ans (neuf ans pour la version française) : offrir à des lecteurs avertis comme vous une information unique sur Israël et le monde juif.
Nous avons aujourd’hui une faveur à vous demander. Contrairement à d'autres organes de presse, notre site Internet est accessible à tous. Mais le travail de journalisme que nous faisons a un prix, aussi nous demandons aux lecteurs attachés à notre travail de nous soutenir en rejoignant la communauté du ToI.
Avec le montant de votre choix, vous pouvez nous aider à fournir un journalisme de qualité tout en bénéficiant d’une lecture du Times of Israël sans publicités.
Merci à vous,
David Horovitz, rédacteur en chef et fondateur du Times of Israel