Maschinelle Übersetzung: Wird der Beruf des Übersetzers überflüssig? • übersetzungsnetzwerk

Autorin: Sarah Schneider, M.A., geprüfte Übersetzerin (IHK, Spanisch), ermächtigte Übersetzerin für die spanische Sprache vom OLG Köln und spezialisiert seit 2008 auf Übersetzungen in den Bereichen Recht und Technik. Kontakt: info@translation-network.de.

Die Qualität von MÜ (Maschinelle Übersetzung) ist in den letzten drei Jahren merkbar gestiegen. Geschuldet ist das Faktoren wie einer Steigerung von Rechenkapazitäten bei so genannten Supercomputern oder auch der praktischen Anwendung neuer Erkenntnisse bei künstlichen neuronalen Netzwerken im Bereich Übersetzung (Florian Faes, Fachzeitschrift MDÜ 6/2019 S. 32f.). So bleibt es nicht aus, dass auch die Rolle des Übersetzers sich ändert – zumindest in einigen Bereichen der Übersetzung, die hier erläutert werden sollen.

MÜ – Was ist das überhaupt und wie funktioniert das?

Peter A. Schmidt, Diplom-Übersetzer, habilitierter Übersetzungswissenschafter und Terminologe, teilt in seinem Werk „Handbuch technisches Übersetzen“ (Peter A. Schmidt, „Handbuch technisches Übersetzen“, BDÜ Fachverlag, Berlin 2016, S. 59f.) die verfügbaren MÜ-Systeme in drei Kategorien ein, und zwar regelbasierte, korpusbasierte und hybride Systeme:

1. Ganz oder vorwiegend regelbasierte MÜ-Systeme

Hier hängt das Ergebnis insbesondere davon ab, wie komplex der zu übersetzende Ausgangstext ist und wie viele mehrdeutige Wörter oder wie viele Präpositionen er enthält. Häufig benötigte Terminologie kann in das System eingepflegt werden und führt zu besseren Ergebnissen. Der wesentliche Nachteil: Das System lernt nicht selbständig dazu, wendet also immer wieder aufs Neue dieselben Regeln an.

2. Statistik- oder korpusbasierte MÜ-Systeme

Diese Systeme funktionieren in der Cloud. Am bekanntesten ist Google Translate. Die Systeme können Texte nur dann übersetzen, wenn ein ähnlicher Text bereits in Ausgangs- und Zielsprache im Korpus enthalten ist. Das Internet-Material, das Google durchsucht, wächst nun bekannterweise täglich, womit Google Translate in der Folge auch immer besser wird. Bei technischen Texten, die es ähnlich formuliert bereits mehrfach gibt, kann laut Schmidt Google Translate damit durchaus gute Chancen haben, eine anständige Übersetzung zu liefern. Nachteil: Bei der Übersetzung fachinterner technischer Dokumentation wie Lasten- und Pflichtenhefte hat das Tool keine Chance. Sie sind im Internet fast nie zugänglich, weshalb Google Translate sie nicht „lernen“ kann.

3. Hybride Systeme

Hybride Systeme kombinieren beide Technologien und können Übersetzungsaufträge zumindest beschleunigen.

Braucht man dann den Übersetzer dann überhaupt noch?

Der Nutzen der maschinellen Übersetzung besteht eindeutig in der Schnelligkeit. Kein Mensch kann so schnell übersetzen, wie eine Maschine. Dazu sind die Ergebnisse nach einer ersten Ernüchterung im Jahr 2018 wesentlich besser geworden und die Technologie ist gereift. Sie hat jedoch weiterhin ihre Grenzen, die sich wohl so schnell auch nicht weiter verschieben lassen werden.

Insbesondere gibt es bestimmte Textsorten, die sich absolut nicht für maschinelle Übersetzung eignen.

Wo liegen die Grenzen maschineller Übersetzung?

Der wohl wichtigste Punkt ist, dass maschinelle Übersetzung Texte produziert, die sich auf den ersten Blick sehr gut lesen lassen und die perfekt erscheinen. Jedoch enthalten die Texte häufig Fehler, die nicht sofort auffallen.

Wie Schmidt (Peter A. Schmidt, „Handbuch technisches Übersetzen“, BDÜ Fachverlag, Berlin 2016, S. 140) in seinem Handbuch anmerkt, liegen die Grundprobleme der MÜ unter anderem bei Polysemie, also Mehrdeutigkeit von Wörtern (wenn es für ein Wort mehrere Übersetzungen gibt) und beim Übersetzen von Präpositionen.

Außerdem tun sich die Systeme meiner eigenen Erfahrung nach mit dem Einbeziehen von Kontext zur Interpretation des Ausgangstextes schwer. Und gerade bei der Übersetzung eines rechtlichen Fachtexts kommt man um diese Interpretation nicht herum. Aber auch andere Fachtexte im technischen Bereich erfordern Fachwissen, das das MÜ nicht ersetzen kann.

Am Beispiel DeepL sieht man noch weitere Grenzen, die die Systeme aktuell aufweisen. Das System scheint es nicht zu schaffen, wie Hans Christian von Steuber, ermächtigter Dolmetscher Übersetzer aus Oldenburg, in der Fachzeitschrift MDÜ 6/19 (S. 24) anmerkt, bestehende amtliche Übersetzungen, die man beispielsweise in Linguee gut findet, zu übernehmen. Als Beispiel führt Steuber die Datenschutzgrundverordnung an. Ich selbst habe diese Problematik mit der SDL Language Cloud getestet und das Ergebnis war dasselbe: Das System findet in der Sprachkombination für eine Übersetzung von Deutsch nach Spanisch für „Haager Übereinkommen zur Befreiung ausländischer öffentlicher Urkunden von der Legalisation“ keine offizielle Übersetzung, obwohl es im Internet zahlreiche Vorlagen und eine Standardübersetzung gibt (u.a. bei Euro-Lex). Das System liefere laut von Steuber daneben zwar ganz brauchbare Vorlagen, jedoch formuliere es nicht straff und elegant. Ein menschlicher Übersetzer lasse daneben auch einmal Redundantes weg – dass tut das System natürlich auch nicht.

Ein wesentlicher Faktor, der entscheidenden Einfluss auf das Ergebnis aus dem MÜ hat, ist die Qualität des Ausgangstexts. Es kommt in der Tat nicht selten vor, dass wir Übersetzer Texte erhalten, die Bezugsfehler, Tippfehler, Terminologieinkonsistenzen oder andere Fehler enthalten. Außerdem kommt es gerade bei technischer Dokumentation vor, dass Texte von Nicht-Muttersprachlern in englischer Sprache verfasst und dann in eine andere Sprache übersetzt werden sollen. Diese Texte enthalten Interferenzen der Muttersprache des Autors, die ein Übersetzer mit entsprechender Kenntnis dieser Muttersprache „abfangen“ kann. All diese Fehler können qualifizierte Übersetzer erkennen und einen Text produzieren, der sogar besser (konsistenter, flüssiger, fehlerfrei) sein kann als der Ausgangstext. Dem MÜ wird diese „menschliche“ Komponente immer fehlen, denn das MÜ arbeitet stets mit einem mathematischen und nicht einem inhaltlichen Prozess.

Die menschliche Komponente: Postediting

Maschinelle Übersetzung sollte daher meines Erachtens keinesfalls (oder nur unter ganz bestimmten Bedingungen) ohne „menschliche Komponente“, das sogenannte Postediting, eingesetzt werden. Dabei prüft ein qualifizierter Übersetzer nicht nur den Zieltext, den das MÜ produziert hat, sondern vergleicht ihn mit dem Ausgangstext. Schmidt merkt, wie ich aus meiner Erfahrung bestätigen kann, treffend an: „Man muss ALLES infrage stellen, ALLES kann falsch sein: Grammatik, Lexik, Inhalt, Stil.” (Peter A. Schmidt, „Handbuch technisches Übersetzen“, BDÜ Fachverlag, Berlin 2016, S. 140).

Das bedeutet, Postediting macht auch nur Sinn, wenn das Ergebnis aus dem MÜ eine entsprechende Qualität aufweist.

Der Übersetzer, der das Postediting durchführt, muss zudem entsprechend spezialisiert sein und über das nötige Fachwissen und die Terminologiekenntnis verfügen, um die Korrekturen, Anpassungen und den Abgleich mit dem Ausgangstext überhaupt vornehmen zu können. Dabei kommt es, je nach Qualität des vom MÜ gelieferten Textes, mitunter vor, dass das Postediting länger dauern kann als eine Neuübersetzung. Dass hat dann für den Kunden nicht die gewünschte Kosteneinsparung oder Zeitersparnis zur Folge.

Florian Faes, Geschäftsführer von Slator, beschreibt das „Problem“ des MÜ in der Fachzeitschrift MDÜ des BDÜ 6/19 wie folgt:

„Unter KI-Experten […] wird die Übersetzung […] von den meisten als sogenanntes „hard problem“ im Bereich KI eingeschätzt. Für die Erstellung einer in allen Belangen erstklassigen Übersetzung sehen viele daher eher den Einbezug von Fach- und Sprachspezialisten bis auf Weiteres als unerlässlich an“.

Welche Texte eignen sich also für MÜ, welche nicht?

Es hängt von vielen verschiedenen Faktoren ab, ob der Einsatz von MÜ sinnvoll ist und auch zur gewünschten Kosten- und Zeitersparnis führt. Einige Faktoren können sein:

1. Zweck der Übersetzung

Es ist dringend davon abzuraten, MÜ ohne Postediting durch einen Fachmann einzusetzen, wenn die Übersetzung die Grundlage für geschäftliche Entscheidungen bilden soll. Auch wenn der Zieltext veröffentlicht werden soll, es sich um einen rechtlichen Fachtext handelt, von dem u.U. Gerichtsentscheidungen abhängen können oder der Text die Visitenkarte des Unternehmens (beispielsweise der Internetauftritt) darstellt, ist MÜ ohne Postediting keine Option. MÜ mit Postediting kann unter Umständen jedoch durchaus Sinn machen, wenn sich der Text dafür eignet.

2. Textsorte

MÜ eignet sich überhaupt nicht (auch nicht mit Postediting) für Texte, bei denen der Kontext oder Referenztexte zur Interpretation des Quelltexts einbezogen werden müssen (viele Rechtstexte, aber auch technische Texte, Lasten- und Pflichtenhefte). Auch eignet es sich nicht für beglaubigte Übersetzungen (beispielsweise Zeugnisse, bei denen die Übersetzung entsprechend kommentiert wird und der Übersetzer über Fachwissen zu den Bildungssystemen verfügen muss) sowie für Romane, Lyrik, Marketing-Texte, kreative Texte jeder Art, etc.

Bei folgenden Texten kann, nach Abwägung der übrigen Punkte, insbesondere des Punktes Datenschutz, ein Versuch gemacht werden, ob sich der Einsatz lohnt und das gewünschte Ergebnis sowie die gewünschte Kosteneinsparung liefert: Werkstattliteratur, Service-Manuals, technische Standard-Dokumentation, standardisierte Rechtstexte, große Textvolumina mit sehr knappen Zeitfenstern, wenn gleichzeitig die Qualität nicht das entscheidende Kriterium ist.

3. Zeitfenster für die Übersetzung

Wenn die Zeit sehr drängt und keine Rücksicht darauf genommen werden kann oder es nicht wichtig ist, dass das Ergebnis qualitativ besonders hochwertig ist, kann hier der Einsatz von MÜ natürlich Sinn machen. Dabei ist wie gesagt zu berücksichtigen, dass die Qualität mitunter leidet (die Übersetzung von Terminologie ist ggf. nicht konsistent) und es können (schwerwiegende) Fehler enthalten sein (siehe weiter unten unter “Risiken”). Die Übersetzung darf also beispielsweise nicht als Grundlage für geschäftliche Entscheidungen fungieren. Sie ist jedoch für den Zweck, für den sie eingesetzt werden soll („ich will nur etwa wissen, was drinsteht, es hat keine Folgen, wenn ich etwas nicht verstehe oder etwas falsch übersetzt wurde“) unter Umständen zu gebrauchen. Dabei ist jedoch in jedem Fall vor dem Einsatz von MÜ noch ein weiteres Thema zu berücksichtigen, und zwar das Thema Datenschutz (siehe weiter unten).

4. Einmaliger oder wiederkehrender Auftrag

Haben Sie regelmäßig Texte zu übersetzen, die sehr ähnlich sind, ist der Einsatz eines MÜ sinnvoll. Hier kann jedoch auch schon ein TMS (Translation Memory System, ein Speicher für übersetzte Segmente) ggf. ausreichend sein, das bei entsprechender Vorbereitung des Textes und bei Anwendung entsprechender DSGVO-konformen Verfahren durch den Übersetzer nicht die Datenschutz-Problematik (s. unten) birgt.

5. Sprachkombination

MÜ kann in einer Sprachkombination ein brauchbares Ergebnis liefern, in einer anderen kann das Ergebnis jedoch ganz anders ausfallen.

6. Qualität des Ausgangstexts

Ein ganz wesentlicher Faktor, der Einfluss auf das Ergebnis aus dem MÜ hat, ist die Qualität des Ausgangstexts. Man mag staunen, aber es kommt sehr häufig vor, dass wir Übersetzer Texte erhalten, die grammatische Fehler, Rechtschreibfehler, Terminologiefehler oder typische „Dreher“ in Sätzen enthalten. Außerdem kommt es gerade bei technischer Dokumentation vor, dass Texte von Nicht-Muttersprachlern in englischer Sprache verfasst und dann in eine andere Sprache übersetzt werden sollen. Diese Texte enthalten Interferenzen der Muttersprache des Autors, die ein Übersetzer mit entsprechender Kenntnis dieser Muttersprache „abfangen“ kann. All diese Fehler können qualifizierte Übersetzer erkennen und einen Text produzieren, der sogar besser sein kann als der Ausgangstext. Dem MÜ wird diese Komponente immer fehlen.

7. Art des MÜ-Systems (regel- oder korpusbasiert, hybrid)

Auch die Art des MÜ entscheidet über das Ergebnis. Welche Art von MÜ-System ausgewählt wird, hängt von der Textsorte ab. Schmidt sagt dazu:

„Es ist sinnlos, ein korpusbasiertes MÜ-Werkzeug wie Google Translate auf fachinterne technische Dokumentation oder auf andere sehr spezielle technische, terminologielastige Dokumente anzusetzen, die im öffentlichen Internetkorpus von Google gar nicht enthalten sein KÖNNEN.

Es ist auch sinnlos, ein regelbasiertes System wie Personal Translator auf einen terminologielastigen technischen Text anzusetzen, wenn die nötige Terminologie nicht zweisprachig im Wörterbuch des Programms enthalten ist und wenn man keine Zeit hat, diese Terminologie in das Benutzerwörterbuch einzupflegen. [….].

Wenn aber der Ausgangstext in kontrollierter oder nach einem Styleguide in besonders klarer Sprache verfasst ist (was immer häufiger der Fall ist) und wenn die nötige Terminologie sowie etwaige typische Phraseologismen im Benutzerwörterbuch enthalten sind, dann (aber auch nur dann!) ist sogar eine vollautomatische maschinelle Übersetzung in hoher Qualität […] möglich. Das dürfte künftig auf Werkstattliteratur wie Service Manuals immer öfter zutreffen.“

Aber nicht nur die Funktionsweise ist entscheidend. Ein Programm kann beispielsweise in einer Sprachrichtung brauchbare Ergebnisse liefern und in einer anderen nicht.

8. Risiken

Ja, MÜ birgt tatsächlich nicht zu unterschätzende Risiken.

Datenschutz

Cloud-basierte MÜ-Dienste wie Google Translate laufen gewöhnlich über Server in den USA und sind meist nicht DSGVO-konform. Es ist also dringend davon abzuraten, Texte mit sensiblen Daten in diese MÜ-Systeme einzugeben. Die Texte müssten dazu entsprechend vorbereitet werden, was wiederum Arbeit macht. Das kann im Unternehmen intern vorgenommen werden oder der Übersetzer kann diese Aufgabe übernehmen.

Die Pro-Version von DeepL ist nach eigenen Angaben DSGVO-konform. In seiner Datenschutzrichtlinie weist das Unternehmen jedoch darauf hin, dass auch in diese Version keine Texte mit personenbezogenen Daten eingegeben werden sollten. Bei so einem Hinweis möchte man auch als Unternehmen ggf. vorsichtig damit sein, hier Dokumente einzulesen, die sensible Daten oder womöglich Geschäftsgeheimnisse enthalten. Datenlecks sind hier also nicht auszuschließen, und diese Lecks können weitreichende rechtliche und finanzielle Folgen für Unternehmen haben.

Fehlerhafte Übersetzungen

Wie schon angesprochen, lesen sich die Ergebnisse, insbesondere bei neuronaler maschineller Übersetzung (bspw. DeepL) so flüssig, dass man Fehler und Abweichungen von Ausgangstext übersieht. Frau Dr. Kelly Neudorfer stellte im Rahmen eines Experiments zur maschinellen Übersetzung von Online-Nachrichten an der Universität Hohenheim in Stuttgart fest, dass teilweise einzelne Wörter fehlten. Das kann mitunter fatale Auswirkungen haben, wenn es sich dabei um Wörter wie „nicht“ oder „kein“ handelt. Es fehlen teilweise auch ganze Satzteile. Oder für Wörter, für die es mehr als eine Übersetzung gibt, wird die falsche Übersetzung ausgewählt. Dabei stellte sie insbesondere fest, dass, da sich das Ergebnis ebenso trügerisch gut liest, es sogar für Sprachexperten schwierig ist, alle Fehler zu finden und nichts zu übersehen (s. Fachzeitschrift MDÜ des BDÜ, 6/19, S. 37). Auch Haftungsfragen stellen sich unter Umständen, wenn es durch fehlerhafte MÜ-Übersetzungen zu einem Haftungsfall kommt, aber keine haftbare Person an dem Text gearbeitet hat.

Zusammengefasst:

Der Mensch kann nie so schnell wie eine Maschine übersetzen

MÜ liefern nicht durchweg schlechte oder komplett unbrauchbare Qualität

Auch (nicht entsprechend qualifizierte) Menschen liefern nicht unbedingt Qualität

Aber: Die Maschine wird wahrscheinlich nie dieselbe Qualität wie ein (entsprechend qualifizierter) Mensch liefern können und MÜ-Übersetzungen bergen das Risiko für fehlerhafte Übersetzungen, die Konsequenzen haben können. Daher sollte MÜ nicht ohne das entsprechende Postediting eingesetzt werden.

Ob MÜ Sinn macht, überhaupt eingesetzt werden DARF (Datenschutz), muss individuell entschieden werden, ggf. an einem Textteil geprüft werden.

Der (nachvollziehbare) Kundenwunsch lautet zumeist: Qualität + Preis + Geschwindigkeit. Meist sind jedoch nur 2 dieser Anforderungen gleichzeitig lieferbar.

Wenn Sie Texte oder Projekte haben, für die Sie MÜ in Betracht ziehen, prüfen wir für Sie gern, ob das in Ihrem Fall ein sinnvolles Vorgehen wäre. Wir bieten die Arbeit mit SDL Languange Cloud an. Das Unternehmen SDL, Hersteller der von uns eingesetzten Übersetzungssoftware, sagt über seine Cloud-Lösung (Zitat):

“SDL Language Cloud

SDL Language Cloud bietet Zugriff auf die Cloud-Technologie von SDL, darunter Terminologie, Online Editor, Workflow-Automatisierung, Translation Memory und viele weitere Funktionen. Dank der benutzerfreundlichen Oberfläche kann der gesamte Lokalisierungsprozess im Unternehmen über SDL Language Cloud verwaltet werden. So können die Teams sich auf spezifische Aufgaben konzentrieren, wie z. B. die Genehmigung von Projekten oder die Überwachung zeitkritischer Lieferungen. SDL Language Cloud umfasst den Zugang zu SDL Neural MT sowie zu Hai, der linguistischen KI von SDL. Diese Technologien sind das Ergebnis von 15 Jahren enger Zusammenarbeit zwischen MÜ-Entwicklern, auf MÜ spezialisierten Sprachexperten und professionellen Übersetzern aus unterschiedlichen Branchen und Fachgebieten.“

Quelle: https://www.sdl.com/de/about/news-media/press/2018/sdl-language-cloud.html

Abkürzungsverzeichnis:

MÜ – Maschinelle Übersetzung

NMÜ – Neuronale Maschinelle Übersetzung

KI – Künstliche Intelligenz

MT – Machine Translation

TMS – Translation Memory System

Kontakt: info@übersetzungsnetzwerk.de – info@translation-network.de