fbpx
Preise
Unverbindliche Anfrage
Maschinelle Übersetzung

05/2023 – Ljubica Negovec

Maschinelle Übersetzung:
Methoden und Schwierigkeiten

Maschinelle Übersetzung ist in aller Munde – nicht zuletzt dank den aktuellen Fortschritten in der KI-Technologie. Doch was ist Machine Translation eigentlich genau, wie funktioniert die automatische Übersetzung und wo liegen ihre Stärken und Schwächen? Wir haben für Sie die wichtigsten Fakten zusammengetragen: Alles zu Entwicklung, Methoden, Vorteilen und Schwierigkeiten der MÜ erfahren Sie hier!

Bevor wir starten, wollen wir aber noch den Begriff selbst klären: Was ist maschinelle Übersetzung?

Maschinelle Übersetzung: Definition

Maschinelle Übersetzung (bzw. Machine Translation) ist die automatische Übersetzung von Text aus einer Sprache in eine andere durch eine Maschine – meist durch eine spezielle Übersetzungssoftware. Man kürzt den Begriff häufig mit MÜ oder MT ab. Zu den berühmtesten Computerprogrammen für maschinelles Übersetzen gehören Google Translate, DeepL und neuerdings auch ChatGPT.

Doch von den ersten Übersetzungsprogrammen hin zu KI-Chatbots war es ein weiter Weg:

Maschinelle Übersetzung im Wandel: Geschichte und Zukunft der MÜ

Die ersten Gehversuche auf dem Feld der maschinellen Übersetzung gab es bereits in den 1960er-Jahren: das US-Militär entwickelte damals ein rudimentäres Russisch-Englisch-Übersetzungsprogramm, dessen Qualität gewiss noch zu wünschen übrig ließ. Das US-Verteidigungsministerium stufte die automatische Übersetzung bald darauf als unrealisierbar ein, was die Forschung bis in die 80er-Jahre zum Erliegen brachte.

Dann jedoch gelang Japan der Durchbruch in der Sprachforschung: Das Land erarbeitete sich mit den weltweit ersten kommerziellen maschinellen Übersetzern für PCs eine Vorreiterfunktion. Seitdem hat sich die Machine Translation immer schneller weiterentwickelt.

Spätestens seit 2006 ist die maschinelle Übersetzung dank Google auch privaten Nutzern zugänglich. Die anfängliche Qualität des Google-Übersetzers hat der MÜ allerdings einen eher wenig schmeichelhaften Ruf eingebracht. Doch diesen hat sie heute längst nicht mehr verdient: Seit 2016 kommen KI-Übersetzer zum Einsatz, die für riesige Qualitätssprünge gesorgt haben.

Ob die tiefliegenden Schwierigkeiten der Übersetzung von kleinsten Sprachnuancen mithilfe der künstlichen Intelligenz (fast) gänzlich überwunden werden können, wird sich zeigen. Fest steht, dass fleißig daran geforscht wird, da man sich davon verspricht, globalisierte kommunikative Abläufe in Wirtschaft, Diplomatie und Militär künftig effizienter gestalten zu können.

Methoden: Wie funktioniert maschinelles Übersetzen?

Digitale Vorgänge hinter einer Anwendung bleiben den Usern oft verborgen. Man füttert die Maschine mit einem zu übersetzenden Satz und bekommt den Satz in der Zielsprache ausgespuckt. Wir sehen uns diesen Vorgang genauer an und stellen uns die Frage: Wie funktioniert maschinelle Übersetzung eigentlich und welche Methoden gibt es?

Regelbasierte maschinelle Übersetzung

Zunächst widmen wir uns der regelbasierten maschinellen Übersetzung. Sie baut, wie der Name schon sagt, auf sprachliche Regelwerke – genauer gesagt eine Kombination aus Sprachalgorithmen, die die grammatischen Regeln der Sprachen enthalten, und den konkreten Wörtern.

Die einfachste und älteste Variante stellt hierbei die direkte Methode dar, bei der tatsächlich wortwörtlich übersetzt wird. Das Ergebnis wird im Nachhinein entsprechend dem sprachlichen Regelsystem korrigiert. Auf dieser Methode beruhte etwa das Russisch-Englisch-System des US-Militärs. Wie man bereits erahnen kann, ist dies die fehleranfälligste Methode und daher mittlerweile obsolet.

Die regelbasierte maschinelle Übersetzung wurde selbstverständlich weiterentwickelt. Die Transfer-Methode schlüsselt den Input z. B. erst in eine Baumstruktur auf, leitet daraus die Bedeutung und Tiefenstruktur ab und überträgt diese in die Zielsprache. Ähnlich ist das Vorgehen bei der Interlingua-Methode, mit dem Unterschied, dass der Transfer in eine Zwischensprache erfolgt, ehe in Richtung der Zielsprache übersetzt wird.

Beispielbasierte maschinelle Übersetzung

Ein beispielbasierter maschineller Übersetzer arbeitet mit einem Übersetzungsspeicher, in welchem ganze Phrasen abgelegt sind. Diese Phrasen können dann gemeinsam mit ihrer Entsprechung abgerufen werden, statt sie Wort für Wort zu übersetzen. Die Eingangsphrase wird zunächst mit allen ähnlichen Phrasen im Speicher verglichen, anschließend wählt das maschinelle Übersetzungssystem die beste Entsprechung.

Statistische maschinelle Übersetzung

Für die statistische maschinelle Übersetzung wird dem Programm erst ein Textkorpus aus Ausgangs- und Zielsprache zur Verfügung gestellt, das es vergleichen kann und woraus es Übertragungsregeln ableitet. Je häufiger Wörter und Phrasen in beiden Sprachen einander zugeordnet werden, desto eher werden sie auch so übersetzt.

Diese Übertragungsregeln dienen dann als Basis für die Übersetzung von Texten, die jenen des ursprünglichen Textkorpus ähneln. Ohne passendes Korpus funktioniert diese Methode allerdings nicht.

Neuronales Netz für die maschinelle Übersetzung

Neuronale maschinelle Übersetzung

Die neueste Disziplin – und gleichzeitig der interessanteste Ansatz beim maschinellen Übersetzen – ist die neuronale maschinelle Übersetzung (engl. Neural Machine Translation). Die Arbeit übernimmt hier ein künstliches, neuronales Netz, das die Zusammenhänge zwischen zwei Sprachen erkennt und sich selbst Übersetzungsregeln beibringt.

Das funktioniert dank Deep Learning – einem Prozess, der das Lernen im menschlichen Gehirn imitieren soll. Dazu sind riesige Datenmengen nötig, aus denen die künstliche Intelligenz lernen kann. Wie genau der maschinelle Übersetzer hier zu seinem Ergebnis kommt, ist allerdings gar nicht so einfach nachzuvollziehen, da das System völlig selbstständig arbeitet. Das Potenzial der KI ist jedenfalls groß.

Maschineller Übersetzer vs. CAT-Tool

Nicht zu verwechseln sind maschinelle Übersetzungssysteme mit den sogenannten CAT-Tools. CAT steht für „Computer-Aided Translation“, ein Computerprogramm hilft also dem menschlichen Übersetzer. Das geschieht mithilfe einer Übersetzungsdatenbank (Translation Memory), in welcher alle bereits getätigten Übersetzungen für einen Kunden abgespeichert werden.

So kann beispielsweise ein Englisch-Übersetzungsbüro dafür sorgen, dass Ihre Firmenterminologie stets einheitlich mit denselben englischen Begriffen übersetzt wird. Der Übersetzer muss denselben Satz zudem nur einmal übersetzen, was Zeit und Geld spart.

Vorteile maschineller Übersetzungssysteme

Gegenüber der traditionellen Übersetzungsarbeit bieten gerade neuronale maschinelle Übersetzer, also künstliche Intelligenzen, einige Vorteile:

✓ Geschwindigkeit und Zeitersparnis

Ein maschineller Übersetzer ist dem menschlichen Übersetzer bezüglich Geschwindigkeit meilenweit voraus. Aufgaben, für die man sonst etwa eine Stunde brauchen würde, erledigt die Maschine in Sekunden oder Sekundenbruchteilen. Zudem benötigen maschinelle Übersetzungssysteme keine Pause, sie arbeiten rund um die Uhr. Für Großprojekte mit umfangreichen Texten ist das ein entscheidender Vorteil.

✓ Günstiger Helfer im Alltag

Kleinere, nur am Rande relevante Texte sind für ein Unternehmen meist nicht wichtig genug, um sie professionell übersetzen zu lassen – beispielsweise viele interne Dokumente. Diese könnten für Ihre Teams in fremdsprachigen Ländern aber durchaus interessant sein. Hier kann die automatische Übersetzung helfen: Sie liefert eine kostengünstige Übersetzung für Informationen, die ansonsten komplett unübersetzt geblieben wären.

✓ Konstante, einheitliche Ergebnisse

Was die Maschine ebenfalls gut beherrscht, sind stets gleich qualitative Texte, die keine Flüchtigkeitsfehler enthalten. Menschen sind immer ein wenig von ihrer Tagesverfassung abhängig, das kann bei der Maschine nicht passieren. Sie liefert immer einen passablen Text, der sich auf den ersten Blick gut liest. Auch Fachterminologie bleibt mithilfe der richtigen Programmierung immer einheitlich.

Diese Vorteile der MÜ sind jedoch immer mit Vorsicht zu genießen – denn „schnell, günstig und einheitlich“ sagt noch nichts über die Qualität einer automatischen Übersetzung aus.

Schwierigkeiten und Probleme: Warum ist Machine Translation nicht perfekt?

Sprache ist ein hochkomplexes System, das zwar mit logischen grammatischen Regeln erklärt, aber niemals in seiner Ganzheit abgebildet werden kann. Computer hingegen arbeiten logisch und binär. Kommunikation besteht aber nicht nur aus 1 und 0, weswegen es Maschinen nicht unbedingt immer leicht haben, der korrekten Bedeutung auf die Spur zu kommen.

X Ambiguität und andere Eigenschaften natürlicher Sprachen

Bei Sprache hat man es auf beinahe allen ihren strukturellen Ebenen mit Ambiguität zu tun. Das hat damit zu tun, dass die Sprache nicht aufgrund von logischen Überlegungen erstellt wird, sondern sich organisch entwickelt. Durch die Vieldeutigkeit, die ein einziger Ausdruck in verschiedenen Kontexten haben kann, hat man bei der Übersetzung oft viel zu tun.

Wir geben zu: die 3 Sätze im vorherigen Absatz sind vielleicht nicht sonderlich elegant formuliert, vor allem nicht in dieser sich wiederholenden Konstellation, aber es zeigt etwas Interessantes auf. „Zu tun haben“ kann abhängig von der Position im Satz, der Kombination mit Präpositionen und weiteren semantisch-syntaktischen Einheiten unterschiedliche Bedeutungen haben. Ein solches Beispiel schafft das Übersetzungsprogramm, …oder? *)

X Schwierigkeiten auf lexikalisch-semantischer Ebene

Wörter setzen sich nicht nur aus einer einzigen Bedeutung zusammen. Sie umfassen ein streng umrissenes und doch variables Feld an Bedeutungen, das sich nicht zwangsläufig genau mit dem Bedeutungsfeld einer fremdsprachigen Entsprechung decken muss. Manchmal sind die Felder enger, manchmal weiter oder es besteht nur eine gewisse Schnittmenge zwischen den Feldern. Dieses Phänomen wird belegt durch ein recht bekanntes „Google-Translate-Fail“ das im Internet kursiert.

maschinelle uebersetzung

Dieser Versuch des Google-Übersetzers, den ersten Satz des Wikipediaartikels zum Thema Volkswirtschaftslehre zu übersetzen, wurde 2017 publiziert. Unser Selbstversuch im Jahr 2019 zeigte, dass die maschinelle Übersetzung des Online-Tools sich zumindest ein kleines Stück verbessert hatte (oder sich die englische Sprache in Bezug auf das Thema differenziert hat). 2019 lautete die Übersetzung immerhin schon wie folgt:

„Economics (also economics, economic political science or social economy, or economics), is a branch of economics.“

Immer noch nicht ideal und sicher auch für die menschliche Übersetzung eine kleine Herausforderung, aber es zeigt die Grenzen, an welche die maschinelle Übersetzung in puncto Semantik stößt.

Ein weiterer Versuch im Jahre 2023 zeigt nun folgendes Ergebnis:

“Economics (also known as national economics, economic state sciences or social economics, or VWL for short) is a sub-area of economics.”

Leider findet der Google-Übersetzer immer noch keine Möglichkeit, Volkswirtschaftslehre und Wirtschaftswissenschaften getrennt zu benennen. Das Kürzel VWL wird hingegen gar nicht übersetzt. Man sieht, dass die künstliche Intelligenz weiterlernt, doch bis zur perfekten automatischen Übersetzung ist es immer noch ein weiter Weg.

Neben dem Google Übersetzer gibt es natürlich zahlreiche weitere Online-Übersetzer, aber sind diese besser? Ein Spitzenkandidat ist DeepL – wie dieses Tool im Gegensatz zu Google abschneidet, können Sie in unserem Vergleich DeepL vs. Google Translate nachlesen.

X Syntax korrekt übertragen

Die Syntax ist noch das, womit die maschinelle Übersetzung potenziell am besten zurechtkommt. Sie unterliegt je nach Sprache strengen Regeln, die in die binäre Logik und Denkweise von Maschinen übertragbar sind. Probleme entstehen dabei meist aus mangelndem Input, wenn der Maschine schlicht zu wenige grammatische Regeln zur Verfügung stehen, um sinnvolle Übersetzungsentscheidungen zu treffen.

X Stilnuancen erkennen und korrekt übersetzen

Die maschinelle Übersetzung ist momentan noch an einem Punkt, an dem sie hauptsächlich mit neutralen Sachtexten zurechtkommt, deren Sprache weniger ambivalent ist als etwa literarische Texte, gesprochene Sprache oder gar Slang. Gilt es jedoch, Stilnuancen zu erkennen und in einer anderen Sprache korrekt wiederzugeben, scheitert die Maschine oftmals.

Ein Mensch wiederum passt seine Übersetzung flexibel an die Bedingungen an: Branche, Textsorte, Fachterminologie oder Laienbegriffe, emotional oder sachlich u. v. m.

X Kultureller Hintergrund

Die Bedeutungsnuancen einer kommunikativen Äußerung ergeben sich oft nur aus dem Kontext oder den jeweiligen Konnotationen. Kommen noch große kulturelle Unterschiede hinzu, die sich in der Sprache sehr oft widerspiegeln, wird es noch schwieriger. Die maschinelle Übersetzung muss das Gesagte so übertragen, dass es von den Sprechern der anderen Sprache auf dieselbe Art und Weise verstanden wird. Für eine Maschine, die kein menschliches Weltwissen besitzt, ist das eine beinahe unlösbare Aufgabe.

Deshalb steht eine korrekte Übersetzung bzw. gar eine umfangreiche Lokalisierung, die mithilfe fundierter sprachlicher, kontextueller und kultureller Kenntnisse durchgeführt wurde, qualitativ weit über einer wackeligen Übersetzung des binär denkenden Computers.

X Datenschutz im maschinellen Übersetzer

Zu bedenken ist zu guter Letzt der Datenschutz. Wenn die Programme für maschinelles Übersetzen mit diversen Schnittstellen verknüpft sind, sind sie auch anfällig für Angriffe von außen. Dadurch werden die zu übersetzenden Texte bzw. Korpora vielleicht für Hände zugänglich gemacht, in denen sie nicht landen sollten.

Maschineller Übersetzer und Mensch

Qualität der MÜ: Beispiele aus unserem KI-Benchmark-Report 2023

Ob diese Herausforderungen der MÜ auch im Jahr 2023 weiterhin Probleme bereiten, haben wir im Selbstversuch festgestellt: Wir haben unser professionelles Übersetzerteam gegen eine etablierte KI-Übersetzungssoftware antreten lassen, um herauszufinden, wie gut sich maschinelle Übersetzer derzeit schlagen.

Das Ergebnis?

Fassen wir es so zusammen: manchmal mehr, häufig eher weniger überzeugend. Obwohl die neuronale maschinelle Übersetzung so vielversprechende Aussichten liefert, hat sie noch viel Verbesserungspotenzial. Viele der getesteten Übersetzungen waren zumindest amüsant, andere wiederum regelrecht gefährlich.

Drei Beispiele aus unserem Test

  • Wenn die KI einen Begriff nicht kennt, kommen die aberwitzigsten Kombinationen heraus. So wird die deutsche „Lifestyle-Sonnenbrille“ im Tschechischen zur „Lebenssonnenbrille“. Dass „Lifestyle“ ein Wort mit eigener Bedeutung ist, hat das Programm nicht verstanden.
  • Dass der Software das Sprachgefühl fehlt, zeigt dieses Beispiel, in welchem die KI nicht gerade sanft mit Kindern im Auto umgeht: Die deutsche „Sicherung des Kindes“ wird im Französischen als „Verzurrung des Kindes“ übersetzt.
  • Ein simpler Tippfehler – für den Menschen sofort erkennbar – bringt den maschinellen Übersetzer oft komplett durcheinander. Wenn im Ausgangstext etwa „Blicker“ statt „Blinker“ (eines Autos) steht, wird daraus u. a. „Zuschauer“ (Russisch), „Browser“ (Slowakisch) oder „Sichtgerät“ (Finnisch). Das macht die sichere Bedienung des Blinkers für fremdsprachige Autofahrer zu einer unnötigen Herausforderung.
Piktogramm KI

Alle Details im KI-Benchmark-Report 2023

Alles über maschinelle Übersetzer, ihre Chancen und Herausforderungen und viele weitere praktische Beispiele aus unserem Test können Sie in unserem Report nachlesen. Werfen Sie gleich einen Blick hinein!

Jetzt lesen

Was bedeutet das für den professionellen Einsatz maschineller Übersetzung?

Solche Übersetzungsfehler sind besonders für renommierte Unternehmen fatal. Stellen Sie sich vor, Sie verkaufen in Ihrem tschechisch-sprachigen Onlineshop eine „Lebenssonnenbrille“. Im Bestfall lachen Besucher Ihrer Produktseite nur kurz – im schlimmsten Fall assoziieren sie den Übersetzungsfehler mit Billigware, die eine gute Übersetzung „nicht wert“ war.

Wir müssen Ihnen wohl nicht erklären, was das für die Verkaufszahlen dieser Sonnenbrille heißen wird.

Und wenn es um die Sicherheit Ihrer Kunden geht, sind Falschinformationen nicht nur umsatzschädigend. Auch Ihr Image leidet langfristig darunter, wenn automatische Übersetzungen Unfälle verursachen!

Kurz gesagt: Für den privaten bzw. internen Gebrauch ist ein maschineller Übersetzer sehr praktisch, im professionellen Umfeld hat er jedoch nichts verloren. Es sei denn, Sie setzen auf das richtige Tool – mit der richtigen menschlichen Unterstützung.
YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Maschinelle Übersetzung durch Online-Anbieter oder kostenpflichtiges Tool?

Bei der Qualität einer maschinellen Übersetzung kommt es darauf an, ob man sich auf Anbieter im freien Internet verlässt, oder sich von offiziellen, hochentwickelten und meist kostenpflichtigen Übersetzungsprogrammen helfen lässt. Was gratis vor allem für private Nutzer zur Verfügung gestellt werden kann, ist vielleicht nicht unbedingt am neuesten Stand der Forschung und kann peinliche Übersetzungsfehler enthalten. Für den privaten Zweck reicht das, ein Unternehmen sollte solche Fehler (und damit verbundene internationale Marketing-Fails) besser nicht riskieren.

Kostenpflichtige maschinelle Übersetzungstools sind beispielsweise:

  • DeepL (Pro-Version)
  • Systran
  • SDL Language Cloud
  • ModernMT

Weitere Tipps haben wir in unserem Ratgeber zu den besten Übersetzungstools zusammengestellt.

Menschliche Unterstützung für den maschinellen Übersetzer

Doch nicht nur das richtige Tool ist entscheidend. Noch viel wichtiger ist, dass die MÜ niemals ohne menschliches Zutun arbeitet. Erst mit der Korrektur durch einen speziell ausgebildeten menschlichen Übersetzer wird aus einem billigen, fehlerhaften MÜ-Text eine hochwertige Übersetzung, die Sie auch im gewerblichen Rahmen problemlos einsetzen können.

Übersetzer Pikto NEgativ

Wenn Qualität ein Muss ist: maschinelle Übersetzung mit Post-Editing

Wenn Sie professionelle Qualität benötigen, empfehlen wir Ihnen die maschinelle Übersetzung mit Full-Post-Editing. Dabei kombinieren Sie das Beste aus beiden Welten: Die Maschine fertigt eine grobe automatische Übersetzung an, die der menschliche Übersetzer korrigiert und auf das gewünschte Niveau anhebt.

Bei ALLESPRACHEN setzen wir dabei auf das 4-Augen-Prinzip: Machine Translation inklusive Post-Editing durch zwei speziell geschulte Übersetzer. So gehen wir sicher, die strengen Qualitätskriterien nach ISO 17100 und ISO 18587 einzuhalten.

Mehr zum Post-Editing erfahren

Fazit: Hat maschinelle Übersetzung eine Zukunft?

Zusammenfassend lässt sich sagen, dass die maschinelle Übersetzung weiterhin in den Kinderschuhen steckt. Für eine einwandfreie Übersetzung, die in der Zielsprache keine Fragen offenlässt oder gar Unverständlichkeit verursacht, werden Maschinen und Programme wohl noch einige Jahre brauchen. Ob sie jemals vollständige Perfektion erreichen werden? Nun ja – wir sind noch nicht überzeugt. Zu groß ist die Gefahr, den eigenen Ruf – und damit auch den Umsatz – zu schädigen.

Bis dahin ist jedenfalls auf ausgebildete Menschen Verlass, die die Ambivalenz von ‚schaffen‘ im Sinne von ‚etwas zustande bringen‘ und ‚sehr anstrengen, mitnehmen‘*) im Kontext erkennen können.
____________________________________

*) etw. schaffen: entstehen, zustande kommen lassen; zustande bringen vs. jmdn. schaffen: sehr anstrengen, mitnehmen, erschöpfen, Quelle: Duden

Bildquellen: © ryzhi – stock.adobe.com; © immimagery – stock.adobe.com; © Who is Danny – stock.adobe.com

FAQ – häufige Fragen zur maschinellen Übersetzung

Was ist maschinelle Übersetzung?

Maschinelle Übersetzung (MÜ) oder Machine Translation (MT) ist die automatische Übersetzung von Text aus einer Sprache in eine andere durch eine Maschine – dafür kommt oft spezielle Übersetzungssoftware zum Einsatz. Einige bekannte Systeme sind Google Translate, DeepL und seit Kurzem auch ChatGPT.

Welche maschinellen Übersetzungstools gibt es?

Die bekanntesten maschinellen Übersetzer sind Google Translate und DeepL. Beide Systeme nutzen die neuronale maschinelle Übersetzung, mit sehr guten Ergebnissen. Darüber hinaus gibt es zahlreiche weitere Tools, z. B. Systran, ModernMT, Microsoft Translator, NLLB-200, ChatGPT u. v. m.

Welches ist der beste Sprachübersetzer?

Für viele Experten ist DeepL die unangefochtene Nummer 1 unter den maschinellen Übersetzungssystemen. Doch auch Tools wie der Google-Übersetzer, Microsoft Translator, Systran, ModernMT oder ChatGPT liefern äußerst überzeugende Ergebnisse. Wichtig ist jedoch stets, dass Sie im professionellen Umfeld nicht blind darauf vertrauen, sondern auf ein menschliches Post-Editing setzen.

Wie funktioniert neuronale maschinelle Übersetzung?

Die neuronale maschinelle Übersetzung basiert auf einer künstlichen Intelligenz und riesigen Datenmengen. Mithilfe eines neuronalen Netzwerks – ähnlich dem menschlichen Gehirn – verarbeitet das System die Daten und leitet daraus selbst Übersetzungsregeln ab. Basierend auf dem Gelernten spuckt es dann die beste Übersetzung aus.