10.3
 Ansätze

4 wichtige technische Ansätze 
Die Übertragung von der QS in die ZS ist primär gesteuert durch:

10.3.1
 Direkte Übersetzung

Oettingers “Automatic Russian-English Dictionary” 

Beispiel 10.3.1 (Russisch zu Englisch).
Humanübersetzung:

In recent times Boolean algebra has been successfully employed in the analysis of relay networks of the series-parallel type.

“Rohübersetzung”:

(In,At,Into,To,For,On) (last,latter,new,latest,worst) (time,tense) for analysis and synthesis relay-contact electrical (circuit, diagram, scheme) parallel-(series, successive, consecutive, consistent) (connection, junction, combination) (with, from) (success, luck) (to be utilize, to be take advantage of) apparatus Boolean algebra.

[Locke und Booth 1955, 55]

Direkte Übersetzung 
Direkte Übersetzung überführt QS ohne linguistisch motivierte Satzrepräsentation in ZS.

Ablauf

PIC

Beispiele: Regeln für direkte Übersetzung 

Beispiel 10.3.2 (Übersetzung von “much/many” nach Deutsch). if preceding word is how return wieviel(e) else if preceding word is as return soviel(e)

Beispiel 10.3.3 (Adjektiv-Stellung und Nominalkomposita).


Englisch Französisch
a visual indicator un indicateur visuel
Regel Art Adj N Art N Adj
installation configuration configuration d’installation
Regel N1 N2 N2 de N1

Problem: Mehrdeutigkeit der Wortart 

Beispiel 10.3.4 (Mehrdeutige Wortform: Englisch nach Französisch).

Diagnose

Dieselbe Wortform in der QS (“use”) steht für verschiedene Wortformen in der ZS (“emploi/N”, “employer/V”).

Minimaler Lösungsansatz

Bestimmen der Wortart in der QS, d.h. Tagging.

Problem: Mehrdeutigkeit von morphologischen Merkmalen 

Beispiel 10.3.5 (Mehrdeutige Wortform: Englisch nach Deutsch).

Diagnose

Dieselbe Wortform in der QS (“loved”) steht für verschiedene Wortformen in der ZS:
liebten /VVFIN:1.Pl .Past.Ind, liebte/VVFIN:3.Sg .Past.Ind.

Lösungsansatz

Um die korrekte finite Wortform im Deutschen zu wählen, muss man wissen:

Dieses Wissen kann eine syntaktische Analyse liefern.

Problem: Mehrdeutigkeit von Wortbedeutungen 

Hauptproblem

Die meisten Wörter haben mehrere Bedeutungen, welche in der ZS unterschiedlich lexikalisiert werden können!

Beispiel 10.3.6 (bank in http://dict.leo.org: Englisch nach Deutsch).

Lösungsansätze

Markierung der Übersetzungspaare nach Fachgebiet (Agronomie, Botanik, Technik) und Stilebene. Heuristik: Bevorzuge ähnlich mehrdeutige Ausdrücken in der ZS! Wortsinndesambiguierung: Berechne die wahrscheinlichste Bedeutung aus dem Kontext!

Probleme/Vorteile der direkten Übersetzung 

10.3.2
 Transfer-Übersetzung

Komponenten eines syntaktischen Transfersystems 


PIC

Abbildung 10.10: Modell der syntaktischen Transferübersetzung


Beispiel: Regeln für Transfer von Syntaxstrukturen 
Die Transfer-Regeln operieren nicht bloss auf der Wortebene, sondern auf allen Konstituenten.


pict
Quelle: [Hess 2005]

Abbildung 10.11: Transfer-Regeln


Beispiel: Analysebaum vom Langenscheidt T1 


pict

Abbildung 10.12: Analysebaum von Langenscheidt T1 (1997)

Beispiel: Transferbaum vom Langenscheidt T1 


pict

Abbildung 10.13: Transferbaum von Langenscheidt T1 (1997)

Problem: Diskrepanzen im syntaktischen Sprachbau 
Die komparative Grammatikschreibung hat die verschiedenen grammatikalischen Prinzipien gesucht und ihre unterschiedlichen Parametrisierungen in den Einzelsprachen beschrieben.

Funktion von syntaktischen Transfer-Regeln

Sie überbrücken Diskrepanzen im Sprachbau auf systematische Weise auf der Syntaxstruktur.

global mismatches

Globale Unterschiede wie etwa Wortstellungsabweichungen stellen für primitive Ansätze bereits eine hohe Hürde dar.

Stellungsregularität Subjekt(S)-Objekt(O)-Verb(V) 
Bei Übersetzungen zwischen Sprachen mit unterschiedlicher SVO-Ordnung sind manchmal grosse Umstellungen notwendig.

Beispiel 10.3.7 (Englisch vs. Japanisch).

Problem: Syntaktische Diskrepanzen 

Beispiel 10.3.8 (Wortstellung).

Beispiel 10.3.9 (Head Switching).

Beispiel 10.3.10 (Zuordnung thematische Rolle zu syntaktischer Funktion).

Beispiel 10.3.11 (Passivkonstruktion).

Beispiel 10.3.12 (Gerundiv-Konstruktionen).

Definition 10.3.13 (idiomatische Wendung, Redewendung). Ein Idiom ist eine feste, mehrteilige Wortgruppe, welche eine semantische Einheit bildet, die nicht aus den Einzelteilen abgeleitet werden kann. Modifikationen oder Austausch von Elementen sind schlecht möglich.

Beispiel 10.3.14 (Idiom).

Übersetzbarkeit von Idiomen

Idiom lassen sich nur in Ausnahmefällen wörtlich von der QS in die ZS übersetzen.

Semantische Diskrepanzen: Kollokationen 

Definition 10.3.15 (collocation). Eine Kollokation ist eine Kombination von Wörtern, welche sich gegenseitig bevorzugt verbinden und andere semantisch denkbare Kombinationen unterdrücken.

Beispiel 10.3.16 (Kollokation).

Übersetzbarkeit von Kollokationen

Wie bei den Idiomen kann die Übersetzung nicht wortweise isoliert erfolgen.

Beispiel: Intensivator als Kollokation 
Eine korrekte Übersetzung von “heavy smoker” in Deutsch oder Französisch bedingt:

Die Intensivierung kann als lexikalische Funktion betrachtet werden, welche vom Kopf einer Konstituente abhängig ist. [Arnold et al. 1994, 127]

Beispiel: Verbgefüge als Kollokationen 

Beispiel 10.3.17 (“support verbs” im Englischen ).

Lexikalische Funktion

Der Kern solcher Kollokationen liegt im Nomen. Die Funktion des Verbs kann sprachübergreifend abstrakt als “support verb” repräsentiert werden. Die genaue Verbalisierung ist aber nicht vorhersagbar, sondern muss im Lexikon erfasst werden.

Syntaktische Mehrdeutigkeit auflösen 

Beispiel 10.3.18 (Mehrdeutige syntaktischen Funktionen: D nach E).

Diese Zeitung liest Peter selten.
(a) This journal seldom reads Peter.
(b) Peter seldom reads this journal.

Diagnose

Die halbfreie Wortstellung des Deutschen muss für die ZS Englisch ins SVO-Schema gebracht werden. Das Subjekt ist in der QS aber nicht morphologisch markiert.

Lösungsansatz: Selektionspräferenzen von Verben

Subjekte vom Verb „lesen“ sind belebt, Objekte davon sind Artefakte.

Mehrdeutigkeit von syntaktischen Funktionen 

Beispiel 10.3.19 (Anbindung von PP: Deutsch nach Englisch).

Den Mann sah die Frau mit dem Fernglas .
The woman with the telescope saw the man.
The woman saw the man with the telescope.

Diagnose

Ob die PP als postnominaler Modifikator oder als Verb-Modifikator fungiert, muss in der Übersetzung partiell aufgelöst werden.

Lösungsansatz für PP-Anbindungsdesambiguierung

Heuristiken (Bevorzuge eine enge Anbindung!) oder statistische Angaben über Präferenzen der Paare V NPP (“sehen”-“Fernglas”) vs. N NPP (“Frau”-“Fernglas”).

Falls die ZS die Mehrdeutigkeit ebenfalls ausdrücken kann, muss allerdings nicht aufgelöst werden.

Mehrdeutigkeit von anaphorischen Beziehungen 

Beispiel 10.3.20 (Bezugsabhängige Wortform: E nach D).

Diagnose

Dieselbe Wortform in der QS (“it”) steht für verschiedene Wortformen in der ZS:
ihn /PPER:3.Sg.Masc .Akk, es /PPER:3.Sg.Neut .Akk.

Problem

Eine syntaktische Analyse allein liefert noch keine Entscheidungsgrundlage.

Fazit zur Transfer-Übersetzung 

10.3.3
 Interlingua-Übersetzung

Interlingua-Übersetzung 

Problem der Konzeptualisierung und Lexikalisierung 
Sprachen machen unterschiedliche Bedeutungsunterscheidungen .

Wieviele Differenzierungen muss eine Interlingua enthalten, wenn verschiedene Sprachen ins Spiel kommen?

Müssen alle einzelsprachlichen Mehrdeutigkeiten immer aufgelöst werden?


pict

Quelle: [Jurafsky und Martin 2008] nach Somers

Abbildung 10.14: Lexikalische Überschneidungen nach Somers


Ansätze der MÜ und reale Systeme 
Reale Übersetzungssysteme sind meistens Kombinationen der geschilderten Ansätze. Wo keine “tiefen” Analysen möglich sind, werden flache Übertragungen gemacht.


pict
Quelle: [Jurafsky und Martin 2008]

Abbildung 10.15: Verbindung von direkter, Transfer- und Interlingua-Übersetzung