Was ist maschinelle Übersetzung? Definition von TechTarget
Die maschinelle Übersetzungstechnologie ermöglicht die Umwandlung von Text oder Sprache von einer Sprache in eine andere mithilfe von Computeralgorithmen.
In Bereichen wie Marketing oder Technologie ermöglicht maschinelle Übersetzung die Lokalisierung von Websites, sodass Unternehmen durch die Übersetzung ihrer Websites in mehrere Sprachen eine breitere Kundschaft erreichen können. Darüber hinaus erleichtert es die mehrsprachige Kundenbetreuung und ermöglicht so eine effiziente Kommunikation zwischen Unternehmen und ihren internationalen Kunden. Maschinelle Übersetzung wird auf Sprachlernplattformen eingesetzt, um Lernenden Übersetzungen in Echtzeit bereitzustellen und ihr Verständnis von Fremdsprachen zu verbessern. Darüber hinaus haben diese Übersetzungsdienste es den Menschen erleichtert, über Sprachbarrieren hinweg zu kommunizieren.
Bei der maschinellen Übersetzung werden fortschrittliche Algorithmen und Modelle des maschinellen Lernens verwendet, um Text oder Sprache automatisch von einer Sprache in eine andere zu übersetzen. So geschieht es im Allgemeinen:
1. Zunächst wird der eingegebene Text oder die eingegebene Sprache durch Filtern, Bereinigen und Organisieren vorbereitet.
2. Anschließend wird das maschinelle Übersetzungssystem anhand von Textbeispielen in mehreren Sprachen und deren jeweiligen Übersetzungen trainiert.
3. Das System lernt und analysiert Beispiele, um Muster und Wahrscheinlichkeiten bei der Übersetzung von Wörtern oder Phrasen zu verstehen.
4. Wenn ein neuer zu übersetzender Text eingegeben wird, verwendet das System das Gelernte, um die übersetzte Version zu generieren.
5. Nach der Erstellung der Übersetzung können einige zusätzliche Anpassungen hinzugefügt werden, um die Ergebnisse zu verfeinern.
Hier sind einige gängige Ansätze, die maschinelle Übersetzung verwendet, um einen Text oder eine Sprache in einen anderen zu übersetzen.
1. Regelbasierte maschinelle Übersetzung (RBMT). Bei der regelbasierten maschinellen Übersetzung werden sprachliche Regeln und Wörterbücher genutzt, um Übersetzungen auf Basis etablierter Sprachregeln und -strukturen zu generieren. Diese Regeln legen fest, wie Wörter und Phrasen in der Ausgangssprache in die Zielsprache umgewandelt werden sollen. RBMT erfordert die Erstellung und Pflege dieser Regeln durch menschliche Experten, was zeitaufwändig und herausfordernd sein kann. Bei Sprachen mit klar definierten grammatikalischen Regeln und weniger Mehrdeutigkeiten und Metaphern ist die Leistung oft besser.
Beispiel: Ein regelbasiertes Übersetzungssystem könnte eine Regel haben, die besagt, dass das Wort „dog“ im Englischen in „perro“ im Spanischen übersetzt werden soll.
2. Statistische maschinelle Übersetzung (SMT). Bei der statistischen maschinellen Übersetzung werden große Mengen zweisprachiger Texte analysiert, um Muster und Wahrscheinlichkeiten für eine genaue Übersetzung zu identifizieren. Anstatt sich auf linguistische Regeln zu verlassen, verwendet SMT statistische Modelle, um die wahrscheinlichsten Übersetzungen basierend auf in den Trainingsdaten beobachteten Mustern zu bestimmen. Es richtet Quell- und Zielsprachsegmente aus, um Übersetzungsmuster zu lernen. SMT funktioniert gut mit größeren Trainingsdaten und kann verschiedene Sprachpaare verarbeiten.
Beispiel: In SMT könnte das System lernen, dass „Katze“ in parallelen zweisprachigen Texten oft im gleichen Kontext wie „Gato“ vorkommt, was zur Übersetzung von „Katze“ als „Gato“ führt.
3. Syntaxbasierte maschinelle Übersetzung (SBMT). Die syntaxbasierte maschinelle Übersetzung berücksichtigt die syntaktische Struktur von Sätzen, um die Übersetzungsgenauigkeit zu verbessern. Es analysiert die grammatikalische Struktur des Ausgangssatzes und generiert eine entsprechende Struktur in der Zielsprache. SBMT kann komplexere Beziehungen zwischen Wörtern und Phrasen erfassen und so genauere Übersetzungen ermöglichen. Es erfordert jedoch ausgefeilte Parsing-Techniken und kann rechenintensiv sein.
Beispiel: SBMT lernt die syntaktische Struktur eines Satzes und stellt sicher, dass die Subjekt- und Verbübereinstimmung in der Übersetzung beibehalten wird, um eine grammatikalisch genauere Ausgabe zu erzielen.
4. Neuronale maschinelle Übersetzung (NMT). Die neuronale maschinelle Übersetzung nutzt Deep-Learning-Modelle, insbesondere Sequenz-zu-Sequenz-Modelle oder Transformatormodelle, um Übersetzungsmuster aus Trainingsdaten zu lernen. NMT lernt, Übersetzungen zu erstellen, indem es den gesamten Satz verarbeitet und dabei den Kontext und die Abhängigkeiten zwischen Wörtern berücksichtigt. Es hat deutliche Verbesserungen bei der Übersetzungsqualität und Sprachkompetenz gezeigt. NMT kann weitreichende Abhängigkeiten bewältigen und natürlicher klingende Übersetzungen erzeugen.
Beispiel: NMT nimmt einen Eingabesatz wie „Die Katze schläft“ und generiert eine Übersetzung wie „El gato está durmiendo“ auf Spanisch, wobei der Kontext und der idiomatische Ausdruck genau erfasst werden.
5. Hybride maschinelle Übersetzung (HMT). Hybride maschinelle Übersetzung kann regelbasierte, statistische und neuronale Komponenten integrieren, um die Übersetzungsqualität zu verbessern. Beispielsweise könnte ein Hybridsystem regelbasierte Methoden zur Behandlung spezifischer sprachlicher Phänomene, statistische Modelle für allgemeine Übersetzungsmuster und neuronale Modelle zur Generierung flüssiger und kontextbezogener Übersetzungen verwenden.
Beispiel: Ein Hybridsystem könnte einen regelbasierten Ansatz zur Handhabung grammatikalischer Regeln, statistische Modelle für gängige Phrasen und ein neuronales Modell verwenden, um flüssige Übersetzungen mit verbessertem Kontextverständnis zu generieren.
6. Beispielbasierte maschinelle Übersetzung (EBMT). Die beispielbasierte maschinelle Übersetzung basiert auf einer Datenbank zuvor übersetzter Sätze oder Phrasen, um Übersetzungen zu generieren. Es sucht nach ähnlichen Beispielen in der Datenbank und ruft die relevantesten Übersetzungen ab. EBMT ist nützlich, wenn es um bestimmte Fachgebiete oder sich stark wiederholende Texte geht, kann aber bei unsichtbarem oder kreativem Sprachgebrauch Probleme bereiten.
Beispiel: Wenn der Satz „Die Katze spielt“ zuvor mit „El gato está jugando“ übersetzt wurde, kann EBMT diese Übersetzung als Referenz für die Übersetzung eines neuen Satzes „Die Katze isst“ abrufen.
Die Geschichte und Entwicklung der maschinellen Übersetzung (MT) lässt sich bis in die Mitte des 20. Jahrhunderts zurückverfolgen, als Forscher begannen, die Idee der Automatisierung des Übersetzungsprozesses zu untersuchen. Hier ein Überblick über die wichtigsten Meilensteine in der Geschichte der maschinellen Übersetzung:
1940er-1950er Jahre. Der Bereich der maschinellen Übersetzung entstand während des Zweiten Weltkriegs, als eine schnelle Übersetzung militärischer und wissenschaftlicher Dokumente erforderlich war. Forscher wie Warren Weaver und Yehoshua Bar-Hillel schlugen die Idee vor, Computer zur Automatisierung von Übersetzungen einzusetzen. Frühe Systeme wie das Georgetown-IBM-Experiment waren regelbasiert und stützten sich auf handgefertigte Sprachregeln.
1960er-1980er Jahre. In den 1960er und 1970er Jahren verlagerte sich die maschinelle Übersetzungsforschung hin zu regelbasierten Ansätzen. In dieser Zeit wurden Systeme wie SYSTRAN und METEO entwickelt, die sich auf sprachliche Analyse und Übersetzungsregeln konzentrierten. Allerdings standen regelbasierte Systeme vor Herausforderungen bei der Handhabung komplexer sprachlicher Phänomene und erforderten einen hohen manuellen Aufwand für die Entwicklung und Pflege der Regelsätze.
1990er-2000er Jahre. In den 1990er Jahren gewann SMT an Bedeutung, als Entwickler große verfügbare Sprachdatensätze nutzten, um statistische Modelle zu trainieren, die Wörter, Phrasenausrichtungen und Wahrscheinlichkeiten erfassen konnten. Durch die Nutzung der statistischen Eigenschaften der Trainingsdaten erreichte SMT eine bessere Übersetzungsqualität.
1990er-2000er Jahre. Im gleichen Zeitraum untersuchten Forscher auch die syntaxbasierte maschinelle Übersetzung. SBMT-Systeme integrierten eine syntaktische Analyse, um den Übersetzungsprozess zu steuern. Syntaxbasierte Ansätze versuchen, die Einschränkungen rein statistischer Methoden bei der Handhabung der Sprachsyntax zu überwinden.
2010er-heute. Die Einführung der neuronalen maschinellen Übersetzung (NMT) in den 2010er Jahren revolutionierte das Fachgebiet. NMT-Modelle, die auf künstlichen neuronalen Netzen basieren, veränderten den Übersetzungsprozess, indem sie lernten, End-to-End-Übersetzungen zu generieren, ohne sich auf explizite Sprachregeln zu verlassen. Systeme wie Google Translate, GPT-3 von OpenAI und Fairseq von Facebook haben erhebliche Verbesserungen der Übersetzungsqualität und -flüssigkeit gezeigt.
Hybride Ansätze, die um die Wende des 20. Jahrhunderts entstanden sind und sich ständig weiterentwickeln, integrieren regelbasierte, statistische und neuronale Ansätze, um eine bessere Übersetzungsqualität zu erreichen. Ziel der Hybridisierung war es, die Vorteile beider Techniken zu kombinieren und ihre individuellen Einschränkungen zu beseitigen.
Neben Fortschritten in der maschinellen Übersetzungstechnologie spielen Post-Editing und computergestützte Übersetzungstools eine wichtige Rolle im Übersetzungsprozess. Beim Post-Editing bearbeiten menschliche Übersetzer maschinell erstellte Übersetzungen und verfeinern sie. Computergestützte Übersetzungstools werden verwendet, um menschliche Übersetzer bei diesem Prozess zu unterstützen, indem sie Funktionen wie maschinelles Übersetzungsgedächtnis, Terminologieverwaltung, Echtzeitvorschläge und Formatierungsunterstützung bereitstellen.
Maschinelle Übersetzung kann vielen verschiedenen Branchen Vorteile bringen.
Maschinelle Übersetzung ist nicht perfekt und erfordert Anpassungen und Verfeinerungen, insbesondere wenn es um Genauigkeit, kulturelle Nuancen, idiomatische Ausdrücke und subjektive Inhalte geht.
Maschinelle Lernsysteme haben immer noch Probleme, den Kontext zu verstehen. Möglicherweise müssen professionelle Übersetzer eingreifen, um die Genauigkeit und Präzision der Übersetzungen sicherzustellen, was die Kosten der maschinellen Übersetzung erhöht.
Für Spezialgebiete wie Jura und Medizin benötigt die maschinelle Übersetzung Zugriff auf domänenspezifische Modelle und Sprachmodelle, um korrekt zu sein.
Darüber hinaus kann die maschinelle Übersetzungstechnologie geschlechtsspezifische und kulturelle Vorurteile in den Trainingsdaten widerspiegeln, was zu fehlerhaften Übersetzungen führt. Aufgrund des Mangels an ausreichenden Trainingsdaten hat es außerdem Schwierigkeiten mit seltenen Sprachen umzugehen.
Aber die Grenzen der Technologie werden abnehmen, zusammen mit Fortschritten beim maschinellen Lernen und der Verarbeitung natürlicher Sprache. Maschinelle Übersetzung ist nach wie vor ein aktives Forschungsgebiet, in dem fortlaufend daran gearbeitet wird, die oben genannten Herausforderungen anzugehen und die Übersetzungsqualität zu verbessern.
Führende Tools und Technologien für die maschinelle Übersetzung Es ist wichtig, den spezifischen Anwendungsfall der maschinellen Übersetzung zu verstehen, bevor Sie sich für ein Tool entscheiden. Hier finden Sie eine Reihe beliebter Tools, die individuell angepasst und für verschiedene Anwendungsfälle verwendet werden können:
Wenn Sie diese vier Best Practices befolgen, können Sie Ihre maschinellen Übersetzungstools optimal nutzen und qualitativ hochwertige Übersetzungen erstellen.
1. Identifizieren Sie Ihre Ziele. Was möchten Sie mit maschineller Übersetzung erreichen? Übersetzen Sie zum allgemeinen Verständnis oder benötigen Sie eine genauere Übersetzung für einen bestimmten Zweck, beispielsweise die Integration von MT in Ihre Modelle?
2. Berücksichtigen Sie das Eingabeformat. Einige maschinelle Übersetzungstools eignen sich für bestimmte Textarten besser als andere. Google Translate eignet sich beispielsweise gut für die Übersetzung kurzer, einfacher Sätze, während DeepL besser für die Übersetzung längerer, komplexerer Texte geeignet ist. Denken Sie daran, das richtige Tool für Ihren Anwendungsfall auszuwählen.
3. Optimieren Sie die Eingabe. Die Qualität der Ausgabe einer maschinellen Übersetzung kann durch die Optimierung der Eingabe verbessert werden. Das bedeutet, den Text korrekt zu formatieren, etwaige Fehler zu entfernen und nach Möglichkeit Kontext bereitzustellen.
4. Bearbeiten Sie die Ausgabe nach. Selbst die besten maschinellen Übersetzungstools können Ergebnisse erzeugen, die von einem menschlichen Übersetzer nachbearbeitet werden müssen. Es gibt jedoch automatisierte Bearbeitungstools, die dies bewältigen können. Dies gilt insbesondere für sensible oder technische Inhalte.
1. Regelbasierte maschinelle Übersetzung (RBMT).2. Statistische maschinelle Übersetzung (SMT).3. Syntaxbasierte maschinelle Übersetzung (SBMT).4. Neuronale maschinelle Übersetzung (NMT).5. Hybride maschinelle Übersetzung (HMT).6. Beispielbasierte maschinelle Übersetzung (EBMT).