Meenzerisch trifft auf KI

Neue Studie der JGU

20.05.20268:19 Uhr

Eine neue Studie der Johannes Gutenberg-Universität Mainz zeigt, dass aktuelle KI-Sprachmodelle erhebliche Schwierigkeiten haben, den Mainzer Dialekt korrekt zu verstehen und zu verarbeiten. Das Forschungsteam unter Leitung der JGU hat mehrere Open-Source-Sprachmodelle anhand eines neu erstellten digitalen Lexikons mit rund 2.400 Dialektwörtern untersucht. Dabei sollten die Modelle sowohl Begriff aus dem Dialekt erklären als auch aus Standarddeutsch passende Dialektwörter erzeugen. Die Ergebnisse fallen deutlich aus: Beim Verstehen und Produzieren des Dialekts erreichen die Systeme nur sehr geringe Trefferquoten. Besonders beim Generieren von Dialektwörtern lag die Genauigkeit bei unter einem Prozent. Die Forschenden führen dies unter anderem darauf zurück, dass Dialekte überwiegend gesprochen werden und nur wenig digitale Textdaten vorliegen. Ziel sei es künftig, sprachliche Vielfalt stärker in digitalen Anwendungen abzubilden.