Kommentare

Jahrtausendealte Keilschrift wird mit künstlicher Intelligenz entschlüsselt

Experten tun sich nach wie vor schwer damit, jahrtausendealte Texte zu entziffern. Künstliche Intelligenz soll auch hier helfen, Keilschrift aus Mesopotamien zu entschlüsseln.

von Carsten Drees am 22. August 2019

Die Rätsel des Lebens und des geschriebenen Wortes – sie sind höchst unterschiedlicher Natur. Ich beispielsweise sitze oft genug vor einem Schmierzettel, auf dem ich mir schnell Notizen gemacht habe und bin nur wenige Stunden nach dem Aufschreiben nicht mehr in der Lage, alles einwandfrei zu entziffern. Das liegt natürlich an meiner Sauklaue und weniger daran, dass zwischenzeitlich die genutzte Sprache ausgestorben ist.

Aber wie verhält es sich, wenn man versucht, jahrhundertealte oder gar jahrtausendealte Fundstücke zu entziffern, Hieroglyphen zu entschlüsseln oder auch die Keilschrift der alten Babylonier? Eben — das ist eine komplett andere Veranstaltung. Es ist zunächst einmal eine komplett andere Schrift in einer fremden Sprache, was die Aufgabe schon schwierig genug macht. Gleichzeitig sind die Fundstücke, auf denen sich diese ausgestorbenen Sprachen finden, aber auch so uralt, dass sie die Jahrtausende nicht schadlos überstanden haben.

Texte sind also oft unvollständig, beispielsweise wenn sie sich auf Scherben befinden, in die sie geritzt wurden und die bei Ausgrabungen in viele tausend Einzelteile zersprungen sind. Ihr könnt euch vermutlich vorstellen, was für eine Sisyphos-Arbeit es sein muss, einen solch alten Text heute zu entschlüsseln. Es ist ein unvorstellbar schwieriges Puzzle, welches teils gar nicht, teils nur mit größtmöglicher Akribie gelöst werden kann.

Der Altorientalist Enrique Jiménez ist so ein Mensch, der sich die Mühe macht, hinter das Geheimnis solch alter Texte zu kommen und hat sich dabei auf das alte Mesopotamien spezialisiert. Wir reden hier von Schriftstücken, die teilweise 3.000 Jahre alt sind! Bereits ab 2.500 Jahre vor Christus bildete sich dort erste von der damaligen Hochkultur genutzte Literatur, die zweisprachig in Keilschrift auf Tontafeln verewigt wurde: In sumerisch und akkadisch.

Das Problem des Spaniers, dessen Wahlheimat Bayern ist und der jetzt zusammen mit der Ludwig-Maximilians-Universität (LMU) München arbeitet: Die guten, alten Mesopotamier hatten es nicht so mit der Rechtschreibung. Soll heißen, dass ein Zeichen je nach Kontext ganz unterschiedliche Bedeutungen haben kann und Wörter zudem auf verschiedene Weisen geschrieben stehen. Wenn man also versucht, aus vielen Tonscherben einen Text zu übersetzen, reicht es schon, dass eine winzige Scherbe mit einem Zeichen fehlt und man kann den übrigen Text nicht mehr entziffern oder nur erahnen.

Es müssen also die Scherben erst einmal richtig zusammengesetzt werden, danach dann steht man immer noch vor der Hürde, dass es für die Zeichen unzählige Lesarten gibt. Genau dabei soll ihm an der Uni in München jetzt ein Experten-Team zur Seite stehen, welches ihm mit künstlicher Intelligenz behilflich ist.

„Es ist unglaublich irritierend, wenn man die Arbeit an einem Text aufgeben muss, weil ein einziges Zeichen fehlt und man weiß, dass es irgendwo ein Fragment gibt, das genau in diese Lücke passt.“ Enrique Jiménez, Altorientalist

Wie kann ihm künstliche Intelligenz hier behilflich sein? Zuvor hat der Wissenschaftler eigene Datenbanken angelegt. Wir reden hier aber von etwa 33.000 Tonscherben, von denen zehntausende Fragmente heute noch weitgehend unentschlüsselt lagern. Der Forscher erklärt, dass es schon mal einen ganzen Tag dauern kann, eine einzige dieser Scherben zu entziffern und sie im Text der richtigen Stelle zuzuordnen.

Deshalb sitzt er jetzt zusammen mit seinem zehnköpfigen Team, um einen Algorithmus zu erarbeiten, der ihm diese Arbeit abnimmt. Alles, was bereits an digitalisierten Textfragmenten vorliegt — das sind bislang 8.000 Fragmente seit Projektbeginn im Mai letzten Jahres — wird in einer Datenbank erfasst.

Ich hoffe, dass wir bis zum Ende dieses Jahres bei 15.000 sind. Dann wird man die Datenbank nach allen bislang unpublizierten Fragmenten aus der Bibliothek von Assurbanipal in einer Sekunde durchsuchen können. Enrique Jiménez, Altorientalist

Momentan wird der Software noch das akkadische Lexikon beigebracht, damit sie alle möglichen Lesarten eines Zeichens erfassen kann. Logischerweise kann ein Computer viel einfacher all diese Lesarten berücksichtigen und mit bereits erfassten Texten abgleichen. Das Ziel ist es, dass das Programm im Endeffekt selbstständig die Zeichensequenzen erkennt und sie dann automatisch in einer Textstelle mit den passenden Wörtern in Verbindung bringt.

Spannend finde ich persönlich dabei, dass es sich um Literatur handelt, die der uns bekannten gar nicht so unähnlich ist. Wir haben es hier also mit Texten zu tun, die schon vor tausenden von Jahren bereits Klassiker waren. Diese wurden wiederum adaptiert, teils auch parodiert und gerade hier liegt eben der Teufel im Detail: Ein einziges falsch gedeutetes Zeichen kann bewirken, dass eine Parodie nicht als solche erkannt wird.

Genau das ist aber eben entscheidend, weil die richtige Deutung der Texte uns wertvolle Informationen überliefern kann, wie der Alltag im alten Mesopotamien ausgesehen haben könnte. Wenn ihr mehr darüber wissen wollt, was konkret bereits an Fragmenten übersetzt werden konnte, schaut unbedingt auf der Seite der Uni in München vorbei, wo auch Beispiele von übersetzten Gedichten zu finden sind.

Ich finde die ganze Nummer hochspannend. Generell, weil es wieder einmal zeigt, welche unglaublichen Möglichkeiten uns mit künstlicher Intelligenz eröffnet werden. Aber auch, weil ich es nahezu atemberaubend finde, dass es Texte gibt, die seit vielen tausend Jahren nicht gelesen werden können — und deren Entschlüsselung nun bevor steht. Es muss ein erhebendes und überwältigendes Gefühl sein, wenn man der erste Mensch ist, der einen Text nach fast 3.000 Jahren wieder lesen kann, oder wie seht ihr das?

Quelle: LMU via heise.de