Wie gut ist Maschinelle Übersetzung?

Authors

Tim Branton

Tim Branton

PureFluent CEO

Ian Gilchrist

Ian Gilchrist

PureFluent Roving Reporter

Share this

Tweet Share Share

More content

  • Top-Tipps, um bessere maschinelle Übersetzungen zu erreichen

    Read now
  • Top-Tipps: So nutzen Sie Ihr gekürztes Übersetzungsbudget optimal

    Read now
  • Ist mehrsprachiger Video-Content gut für SEO?

    Read now
  • PureFluent introduces the first Translation Subscription Service - WordStore

    Read now
  • Wie kann ich als Kunde die Übersetzungsqualität beurteilen?

    Read now
  • Pentland Brands talk about their drive to provide shoppers with a great experience on Amazon

    Read now
  • Bringen Übersetzungen Vorteile im E-Commerce, auch wenn die Kunden Englisch verstehen?

    Read now
  • Reicht Englisch für meine Kunden aus?

    Read now
  • Untertitel oder Voiceover? Was ist besser für Video-Content?

    Read now
  • Gig-Economy, Scheinselbstständigkeit, digitale Tagelöhner, Clickworker. Inwiefern treffen diese viel diskutierten Schlagwörter auf die Übersetzungsbranche zu?

    Read now

August 9, 2019

In unserem zweiten Blog geht es um das Thema Maschinelle Übersetzung (MÜ oder MT). Tim Branton spricht über den aktuellen Stand der Entwicklung und darüber, ob maschinelle Übersetzung eine Option für Ihre Firma sein kann.

Ian: Wir alle haben schon lustige oder sogar absurde maschinelle Übersetzungen gesehen, die zum Beispiel von Google übersetzt wurden. Wird maschinelle Übersetzung besser und sollten Firmen diese Option daher zumindest in Betracht ziehen?

Tim: Maschinelle Übersetzung hat eine lange Geschichte, die in den 50er Jahren als ein erstes Konzept begann. Damals war man sicher, in 20 Jahren Humanübersetzer vollständig durch maschinelle Übersetzung ersetzen zu können. Weit gefehlt, wie man heute weiß.

Es gab und gibt drei grundlegende Phasen und Ansätze der maschinellen Übersetzung, aber erst in den letzten fünf Jahren gelang der wirkliche Durchbruch. Phase 1 war „regelbasiert“ und begründete sich auf der Annahme, dass man einen Computer einfach mit einer Reihe von Regeln für eine bestimmte Sprachkombination füttert, ein umfangreiches Wörterbuch hinzufügt et voilá. Das Computerprogramm wäre dann in der Lage, die Regeln mit dem Wörterbuch zu kombinieren, um Texte automatisch zu übersetzen. In der Praxis stellte sich dann aber schnell heraus, dass Sprachen in Aufbau und Syntax einfach viel zu komplex sind, um alle Möglichkeiten und Ausnahmen mit einer Reihe von Regeln abzudecken.

In den 90er Jahren entstand Phase 2, die statistikbasierte Methode. Hier ging man davon aus, dass man aufgrund von Statistiken die wahrscheinlichste Übersetzung in einem bestimmten Kontext herausfinden kann. Dies war schon ein erfolgreicherer Ansatz, der auch in den Anfangszeiten von Google Translate eingesetzt wurde, und die Ergebnisse maschineller Übersetzung wurden eindeutig besser. Aber für den professionellen Einsatz immer noch nicht gut genug.

Um wieder auf die Frage „Ist maschinelle Übersetzung besser geworden?“ zurückzukommen, ja, eindeutig.

Der große Durchbruch (Phase 3) gelang dann dank erheblich höherer Rechenleistung und der Einführung von Cloud Computing ab den späten 90ern. Der Begriff der Stunde heißt NMT oder Neural Machine Translation. Die heute verfügbare Rechenleistung in Verbindung mit künstlicher Intelligenz hat diesen revolutionären Ansatz möglich gemacht. Mithilfe von Maschinellem Lernen und bereits übersetzten Inhalten kann man eine so genannte „Übersetzungsmaschine“ trainieren. Die Maschine lernt also durch vorherige Übersetzungen plus KI, wie Texte in einem bestimmten Kontext übersetzt werden können.

Dies funktioniert natürlich besonders gut, wenn Ausgangs- und Zielsprache syntaktisch ähnlich aufgebaut sind. Auch bestimmte Textarten, wie technische Dokumentation oder Rechtstexte eignen sich aufgrund der sehr einheitlichen Struktur und Terminologie besser als andere.

Wenn die Syntax jedoch sehr unterschiedlich ist, wie z. B. beim Sprachenpaar Englisch-Deutsch, muss normalerweise mehr nachgebessert werden. Auch bei kreativeren Texten liegt die maschinelle Übersetzung oft richtig daneben.

Um aber wieder auf die Frage „Ist maschinelle Übersetzung besser geworden?“ zurückzukommen, ja, eindeutig. Sie können das bei Google Translate selbst ausprobieren. Die maschinelle Übersetzung einfacher Sätze ist oft schon erstaunlich gut. Und der Grund dafür ist, dass ein sehr ähnlicher oder identischer Inhalt bereits schon einmal von einem Humanübersetzer übersetzt wurde.

Genau dies muss man sich also vor Augen halten: Maschinelle Übersetzung passiert immer auf der Grundlage einer Humanübersetzung. Das Zauberwort ist Maschinelles Lernen, d.h. die Maschine erkennt die Muster von bereits (von Menschen) übersetzten Texten, lernt daraus und kann sie auf neue Texte anwenden.

Ian: Also sprechen wir im Grunde über eine riesige Datenbank, die neue Texte mit vorhandenen Daten vergleicht und diese anwenden kann?

Tim: Ein bisschen komplexer ist es natürlich schon. Über Algorithmen kann die Maschine den gesamten Inhalt analysieren, bewerten, Muster erkennen und daraus lernen. Dies passiert natürlich nicht in einem einzigen Durchgang. Am Anfang trainieren Sie die Maschinen mit den vorhandenen Daten, sprich Übersetzungen und Glossaren. In regelmäßigen Abständen wird die Maschine dann mit neuen Übersetzungen erneut trainiert, um die Ergebnisse der ersten maschinellen Übersetzung zu verbessern. Die Maschine erfasst durch die bei der Nachbearbeitung durch einen Übersetzer gemachten Änderungen, was falsch und was richtig war, und lernt daraus. Auch die Eingabe von firmen- bzw. kontextspezifischer Terminologie erhöht die Qualität. Wenn Sie zum Beispiel die deutsche Übersetzung für einen englischen Begriff suchen, gibt es oft mehrere Optionen. In einem konkreten Kontext könnte aber nur eine Übersetzung richtig sein. Daher ist es unglaublich wichtig, dass die Maschine auch den Kontext versteht.

Je mehr Daten die Maschine also auswerten kann und daraus lernt, desto besser werden die Entscheidungen in Bezug auf Syntax und Terminologie, die sie trifft.

Ian: Ok, und auch wenn man das alles verstanden hat, wie kann ein Kunde wissen, ob maschinelle Übersetzung eine Option für seine Anforderungen ist?

Tim: Ganz einfach: ausprobieren. Sprechen Sie mit uns oder einer anderen Agentur, die maschinelle Übersetzung anbietet, und lassen Sie testen, ob sich Ihre Texte für MÜ eignen.

Ein paar Faktoren sind dafür ausschlaggebend. Wenn Sie kontinuierlichen Übersetzungsbedarf haben und schon viele Übersetzungen vorhanden sind, dann ist es sicher sinnvoll, sich mit dem Thema zu befassen. So können Sie das vorhandene Übersetzungsbudget optimal einsetzen.

Ein weiterer Faktor ist Ihre Branche, sprich, mit welcher Art von Texten wir es zu tun haben. Wenn Sie zum Beispiel Software für einen ganz bestimmten Bereich entwickeln, sagen wir mal CAD oder Buchhaltung, dann könnten Sie vermutlich schon mit einem verhältnismäßig kleinen Korpus an bestehenden Übersetzungen ein relativ gutes Ergebnis erzielen.

Die Faustregel ist: Je mehr Daten (Übersetzungen) Sie der Übersetzungsmaschine für das Training bereitstellen können und je spezifischer die Thematik, desto besser wird das Ergebnis der maschinellen Übersetzung.

Wenn Sie eine Million Euro pro Jahr für Übersetzungen ausgeben, dann sollten Sie die Option der maschinellen Übersetzung auf alle Fälle in Betracht ziehen. Vielleicht nicht für alle Texte, aber für einige. Damit komme ich zurück auf die bereits erwähnte Bedeutung der Textart. Wenn Sie technische Dokumentation übersetzen, kann maschinelle Übersetzung geeignet sein und die Kosten reduzieren. Wenn wir über kreative Marketingtexte sprechen, dann eher nicht.

Wenn Sie die Wahl zwischen maschineller Übersetzung und keiner Übersetzung haben, wie entscheiden Sie dann? In einigen Fällen ist es sicherer, den Inhalt eher unübersetzt zu lassen als maschinell zu übersetzen, weil ein Fehler oder eine Missinterpretation Konsequenzen haben könnte. In stark regulierten Branchen könnte es fatale Folgen haben, Texte nicht von qualifizierten Fachübersetzern anfertigen zu lassen. Bei bestimmten verbraucherorientieren Texten hingegen kann es besser sein, dem Kunden zumindest eine maschinelle Übersetzung anzubieten als gar keine.

Damit komme ich auf einen weiteren Punkt: Was erwartet der Kunde? Maschinell übersetzte Texte werden allgemein für bestimmte Texte akzeptiert, solange sie als solche zu erkennen sind. Und dann werden auch nicht ganz idiomatische Übersetzungen hingenommen, solange man den Inhalt versteht. Wenn Sie beispielsweise Bewertungen in Amazon oder Airbnb lesen, erwarten Sie vermutlich keine perfekte Übersetzung. Sie wollen einfach nur wissen, ob das Produkt oder die Unterkunft positiv oder negativ bewertet wurde. Es reicht also, sehen zu können, ob das Produkt die Erwartungen erfüllt hat oder die Unterkunft sauber und wie in der Anzeige beschrieben vorgefunden wurde. Wenn Sie diese grundlegende Information nicht in der Muttersprache des möglichen Kunden bereitstellen, könnte er sich für ein anderes Produkt oder eine andere Unterkunft entscheiden. Warum würden Sie dies also nicht tun?

Ian: Wie unterscheide ich aber zwischen „wichtig“ und „nicht wichtig“ oder „kritisch“?

Tim: Die stark regulierten Branchen habe ich ja bereits erwähnt, da kommt maschinelle Übersetzung einfach nicht infrage. Man muss sich im Grunde überlegen, was in kommerzieller Hinsicht wichtig ist bzw. in Bezug auf Sicherheitsaspekte oder rechtliche Fragen.

Wenn wir also auf unsere Kundenbewertungen zurückkommen, das bedeutet Content, der nicht von Ihrer Firma sondern vom Endverbraucher geschrieben wurde, dann möchten Sie diese Inhalte einfach für Kunden anderer Zielsprachen irgendwie verständlich machen, mehr nicht. Kritisch bedeutet hier, dass Texte für das Image der Firma bzw. der Produkte relevant sind oder in Bezug auf Sicherheit oder rechtliche Aspekte.

Wir entscheiden also nicht nur zwischen Maschinenübersetzung und Humanübersetzung, weil die maschinelle Übersetzung in den meisten Fällen von Humanübersetzern nachgebessert wird.

Es ist wichtig zu verstehen, dass wir uns nicht zwischen maschineller und humaner Übersetzung entscheiden müssen. In den meisten Fällen wird die maschinelle Übersetzung ohnehin durch einen Übersetzer nachgebessert, wodurch die Maschine wiederum dazulernt. Auf diese Weise können Sie mittelfristig bereits ein sehr gutes Ergebnis beim ersten Durchgang der maschinellen Übersetzung erzielen. Und der Übersetzer hat anschließend weniger Arbeit mit der Korrektur, was weitere Zeit und Kosten spart. Letztlich soll die Qualität Ihrer Übersetzung so nah wie möglich an eine professionelle Humanübersetzung heranreichen. Und je besser die Übersetzungsmaschine trainiert ist, desto leichter wird es für den Übersetzer bei der Nachbearbeitung, eine gute Qualität zu erreichen.

Im Umkehrschluss bedeutet dies, dass die Qualität der maschinellen Erstübersetzung bei schwierigen Texten und Sprachkombinationen sowie wenig Trainingskorpus so schlecht sein kann, dass der Übersetzer eher geneigt ist, komplett neu zu übersetzen. Ansonsten ist die Gefahr, Fehlübersetzungen oder Auslassungen zu übersehen, einfach zu hoch. Die folgende Entscheidung muss immer getroffen werden: Ist die maschinelle Übersetzung in einigen Fällen gut genug, um sie ohne Nachbearbeitung zu verwenden? Zum Beispiel zu rein informativen Zwecken. Oder sollte die Qualität so weit wie möglich an die einer Humanübersetzung heranreichen und der Text daher von einem Übersetzer nachbearbeitet werden. Wenn dies der Fall ist, dann muss die maschinelle Erstübersetzung so gut sein, dass der Übersetzer wirklich viel weniger Zeit für die Nachbearbeitung braucht. Sonst ist der Einsatz von MÜ unsinnig.

Ian: Und zum Schluss eine Frage, Tim, die sich bestimmt absolut jeder stellt, der maschinelle Übersetzung in Betracht zieht: „Wie sieht es mit den Kosten aus, wie viel kann ich sparen?“

Tim: Ich sprach am Anfang über die immense Rechenleistung, die uns heutzutage zur Verfügung steht. Dadurch ist das Handling großer Datenmengen sehr viel günstiger geworden. Die Übersetzungsmaschine zu trainieren, ist aber immer noch ein nicht außer acht zu lassender Kostenpunkt. Er hängt also davon ab, wie viel Content Sie haben, über den die Übersetzungsmaschine lernen kann. Je mehr Content, desto teurer wird es zunächst. Andererseits sparen Sie dann aber auch in Bezug auf Nachbearbeitungszeit und -kosten. Wenn Sie also vorab in das Training der Übersetzungsmaschine durch vorhandene Übersetzungen und Terminologie investieren, können Sie im Folgenden Zeit und Kosten sparen.

Die Übersetzungen von diesem Punkt an würden rund 95 % weniger kosten als eine Humanübersetzung. Wenn Sie dann aber eine Nachbearbeitung hinzufügen, steigen die Kosten wieder deutlich. In diesem Szenario können Sie vielleicht 40 % sparen. Aber das hängt von vielen verschiedenen Faktoren ab. Wie nahe muss das Ergebnis an einer perfekten professionellen Übersetzung sein? Um welche Art von Text handelt es sich und um welche Sprachen? Es kann also mehr als 40 % sein, aber auch weniger.

Und wenn die maschinelle Übersetzung nicht gut genug ist, dann hat es auch keinen Zweck, zu versuchen, die Qualität durch Nachbearbeitung zu retten. Der Übersetzer würde ebenso lange wie für eine neue Übersetzung oder sogar länger brauchen. Hinzu kommt das bereits erwähnte Risiko, etwas zu übersehen. Naturgemäß ist ein Übersetzer eher geneigt, etwas als richtig anzusehen, wenn es syntaktisch richtig erscheint.

Eine Maschinenübersetzung muss also zumindest so gut sein, dass die Nachbearbeitung erheblich schneller geht als eine Neuübersetzung.

Und was ich noch ganz zum Schluss einwerfen möchte: Die meisten großen Firmen greifen auf maschinelle Übersetzung zurück, aber selbst Google lässt die wichtigsten Inhalte von professionellen Übersetzern machen. Das Wichtigste ist also, eine gute Strategie für die verschiedenen Inhalte zu haben.

About the authors

Tim Branton Tim Branton

Tim Branton is PureFluent's CEO and a passionate advocate for the role of technology in the language industry. He has 30 years of business experience across the chemicals, telecoms, business services and software sectors in the UK, Singapore, Japan, China and South Africa.


See all posts by Tim Branton
Ian Gilchrist Ian Gilchrist

Ian has worked in music and home entertainment product development, marketing, and journalism in the U.S., Canada and the UK, where he currently lives, for over 30 years.

In that time he's has aided and abetted an eclectic array of artists including Alison Krauss, Talking Heads, Madeleine Peyroux and Slade, and has worked for a diverse range of labels and companies including Universal Music (Canada), Pioneer LDC (Europe), Milan Records (France), the British Film Institute (BFI), Rounder Records Group (Canada) and BMG (UK). In his guise as a film journalist Ian's interviewed many renowned and influential people, including director John Carpenter (Halloween), actors Jesse Eisenberg (The Social Network) and Tom Hardy (Venom), director Roman Polanski (Chinatown), and many more.


See all posts by Ian Gilchrist

Share this

Tweet Share Share