11.2. Ansätze
4 wichtige Ansätze
Die Übertragung von der QS in die ZS ist primär gesteuert durch:
- Wortfolge mit mophosyntaktischer Information
: Direkte Übersetzung
- Syntaktische Struktur
: Transfer-Übersetzung
- Semantische Repräsentation
: Interlingua-Übersetzung
- Frequenzdaten von Übersetzungspaaren
: Statistische Übersetzung
11.2.1. Direkte Übersetzung
Direkte Übersetzung
Die direkte Übersetzung führt die QS ohne linguistisch motivierte Zwischenrepräsentation in die ZS
über.
Ablauf
- Bestimmung von Wortarten
, Grundformen
und morphosyntaktischen Merkmalen
der Wörter in der QS
- Wortwahl
(=Lemmawahl) in der ZS
- Anwenden von Übertragungsregeln
anhand der lexikalischen und morphosyntaktischen Information
- Morphologische Generierung
der Wortformen der ZS
Beispiel 11.2.1 (Wortwahl “much/many”).
if preceding word is “how” return “wieviel(e)” else if preceding word is “as” return “soviel(e)”
Beispiel: Regeln für Direkte Übertragung
Beispiel 11.2.2 (Adjektiv-Stellung und Nominalkomposita von Englisch zu Französisch).
- a visual indicator → un indicateur visuel
- installation configuration → configuration d’installation
Regeln für die direkte Übertragung
- E-Art E-Adj
E-N
→ F-Art F-N
F-Adj
“Falls in der QS die Folge Artikel, Adjektiv, Nomen vorliegt, dann produziere in der ZS die
Reihenfolge Artikel, Nomen, Adjektiv.”
- E-N1
E-N2
→ F-N2
de
F-N1
“Falls in der QS zwei Nomen hintereinander stehen, dann produziere in der ZS die vertauschte
Reihenfolge mit einem de-Element dazwischen.”
Probleme/Vorteile der direkten Übersetzung
- Eine grosse Anzahl Übertragungsregeln
entsteht wegen der schlechten syntaktischen Abstraktion. So muss für “the preliminary
installation configuration → la configuration d’installation préliminaire” eine weitere Regel
gemacht werden. Welche?
- Jede Übersetzungsrichtung braucht ein eigenes Programm.
- Wartung und Weiterentwicklung wird schnell zu komplex, weil die Grammatik nicht explizit
repräsentiert ist.
- Die direkte Übersetzung ist grundsätzlich robust gegenüber syntaktischen Schwierigkeiten (Fehler
oder zu komplexe Strukturen).
- Allgemeine Behandlung von unbegrenzten Konstruktionen wie Komposita ist schlecht machbar.
“computer periphery installation configuration manual”
11.2.2. Transfer-Übersetzung
Transfer-Übersetzung im Bild
Beispiel: Regeln für Transfer von Syntaxstrukturen
Die Transfer-Regeln operieren nicht bloss auf der Wortebene, sondern auf allen Konstituenten. (Vgl. http://www.cl.uzh.ch/clab/ecl1/ilap_transf/)
Komponenten eines Transfersystems
- Syntaxanalyse der QS (Grammatik, Lexikon, Parser)
- Transfer-Modul (lexikalische und syntaktische Transfer-Regeln)
- Generierungsmodul der ZS (Grammatik, Lexikon, Generator)
- Morphologie-Module für QS und ZS
- Module zur Auflösung von Mehrdeutigkeiten
Fazit zur Transfer-Übersetzung
- Dominierendes Paradigma der heutigen MÜ (aber schon 1950 konzipiert)
- Nur die Transfer-Regeln müssen für jede Übersetzungsrichtung entwickelt werden.
Generierung und Analyse bleiben (hoffentlich) gleich.
- Unbegrenzte Konstruktionen lassen sich rekursiv elegant übertragen.
- Sprachen, welche wenig Ähnlichkeiten haben, sind viel schwieriger als verwandte Sprachen.
- Welche syntaktischen Konstruktionen existieren überhaupt?
- Was tun, wenn Sätze der QS nicht geparst werden können? Wie bekommt man die
intendierte Analyse?
11.2.3. Interlingua-Übersetzung
Interlingua-Übersetzung
- Bei der Transfer-Übersetzung müssen die syntaktischen Analyseresultate so gewählt
werden, dass der Transfer zu verschiedenen Sprachen optimal ist.
- Der Interlingua-Ansatz versucht, alle Einzelsprachen auf eine gemeinsame Repräsentation
(meist bedeutungsorientiert) abzubilden.
- In der Praxis haben sich diese Systeme nicht durchgesetzt – trotz der an sich bestechenden
Idee.
- Problem: Wie soll diese Interlingua genau aussehen? Welche begrifflichen Differenzierungen
verlangt sie?
11.2.4. Kombinierte Ansätze
Ansätze der MÜ und reale Systeme
Reale Übersetzungssysteme sind meistens Kombinationen der geschilderten Ansätze. Wo keine “tiefen”
Analysen möglich sind, werden flache Übertragungen gemacht.