[ Weiter ] [ Zurück ] [ Zurück (Seitenende) ] [ Seitenende ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]
Maschinelle Übersetzung, Machine Translation (MT)
Vollautomatische Übersetzung eines natürlichsprachlichen Textes in eine andere natürliche Sprache.
Maschinelles Dolmetschen, Machine Interpretation
Vollautomatische Übersetzung gesprochener Sprache in eine andere natürliche Sprache (auch Speech-To-Speech Translation).
Quellsprache (QS), source language (SL)
Die Sprache, die man übersetzen will.
Zielsprache (ZS), target language (TL)
Die Sprache, in die man übersetzen will.
Übersetzungsrichtungen
Die Anzahl der Übersetzungsrichtungen für n Sprachen ist n × (n − 1).
20 offizielle Sprachen der EU bis Ende 2006
Englisch, Deutsch, Französisch, Italienisch, Spanisch, Portugiesisch, Griechisch, Holländisch, Dänisch, Schwedisch, Finnisch, Tschechisch, Estnisch, Litauisch, Lettisch, Ungarisch, Maltesisch, Polnisch, Slowenisch, Slowakisch
3 neue offizielle Sprachen der EU ab 2007
Irisch, Rumänisch, Bulgarisch
Beispiel 10.2.1 (Übersetzungsrichtungen in der EU).
Für die 20 Sprachen der EU bis 2006 gab es 20 × 19 = 380 Übersetzungsrichtungen. Wieviel mehr sind
es mit den 23 Sprachen?
Sprachendienst der EU
Die EU verwendet und entwickelt seit Jahrzehnten ein eigenes MÜ-System (“Euro Systran”). 1998 wurden 370’000 Seiten übersetzt und ca. 35% Übersetzungszeit eingespart.
Computerunterstützte Übersetzung
Definition 10.2.2 (computer aided (assisted, based) translation (CAT)). Computerunterstützte Übersetzung kombiniert menschliche und maschinelle Übersetzungsleistung.
Computergestützte Humanübersetzung (MAHT)
Definition 10.2.3 (CAT-Software). In der computergestützten Humanübersetzung wird Software eingesetzt, welche den Übersetzungsprozess optimiert:
Vorgehen bei TM-basierter Übersetzung
100%-Matches garantieren keine fehlerfreie Übersetzung!
Beispiel: Partieller Match (Fuzzy Match)
Die Übereinstimmungsquote für einen Übersetzungsvorschlag lässt sich einsehen oder einstellen.
Beispiel 10.2.4 (Partieller Match).
Der aktuell vorliegende Text, sowie das im TM abgelegte Übersetzungspaar wird angezeigt. Nicht
übereinstimmendes Material in der QS ist gelb, Vertauschung ist blau markiert.
Erstellung von Translation-Memories
Ansätze automatischer Satz-Alignierung
Exkurs: Satzlängenbasierte Alignierung
Ansatz von [Gale und Church 1993]
Zuordnungsverhältnisse
In der Praxis lassen sich die Übersetzungen auf Satzebene fast immer vollständig mit 0:1-, 1:1-, 1:2- und 2:2-Verknüpfungen zuordnen.
Zuordnung | Häufigk. | Fehler |
1:1 | 89% | 2% |
1:2 | 9% | 9% |
0:1 | 1% | 100% |
2:2 | 1% | 33% |
Exkurs: Wortbasierte Satzalignierung
Iterativer Algorithmus zur satzweisen Alignierung nach [Kay und Roscheisen 1993]
Alternative zur Verankerung
Verwende nummerische Ausdrücke, Eigennamen, Formatierungen zur Bestimmung der besten Ankerkandidaten.
Parametrisierung der Alignierung bei Trados WinAlign
Alignment über Dokumentstruktur
Human-Aided Machine Translation (HAMT)
Definition 10.2.5. HAMT bezeichnet Übersetzungsszenarios, bei denen einen maschinelle Übersetzung durch gezielte manuelle
ergänzt wird.
Die Operationen der Prä- oder Postedition können auch interaktiv geschehen.
Fully automatic high quality translation (FAHQT)
Menschliche Übersetzungsqualität durch vollautomatische MÜ
Weiterhin utopisch, auch wenn sich immer wieder Leute finden lassen, welche Gegenteiliges für die nahe Zukunft prognostizieren!
Aber
Frage
Welche Textsorten eignen sich für automatische Übersetzung? Nach Schwierigkeitsgrad geordnet (*=ohne manuelle Bearbeitung;**=mit Vor-/Nachredaktion; ***=zur Zeit unmöglich):
Der Einsatz von Übersetzungsgedächtnissen und ausgebauter Terminologie hat allerdings einen grossen Einfluss auf die Qualität der Resultate bei Texten der Kategorien ** und ***.
Beispiel 10.2.6 (Englische und französische Wetterberichte aus Kanada).
Tonight..Cloudy. 60 percent chance of showers early this evening. Periods of rain beginning this
evening. Becoming windy near midnight. Low 7. Ce soir et cette nuit..Nuageux. 60 pour cent de
probabilité d’averses tôt ce soir. Pluie intermittente débutant ce soir. Devenant venteux vers minuit.
Minimum 7.
Das berühmte FAHQ-Übersetzungssystem METEO
Von 1978-2001 war das Übersetzungssystem METEO (in verschiedenen Versionen) in Kanada für MÜ von Englisch nach Französisch im Dienst. 1991 wurde ca. 45’000 Wörter pro Tag damit übersetzt.[Chandioux 1991]
[ Weiter ] [ Zurück ] [ Zurück (Seitenende) ] [ Seitenbeginn ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]