Das
Wort-für-Wort Übersetzungssystem
Unser Wort-für-Wort-Übersetzungssystem
ist in Prolog geschrieben. Den Programmcode findest Du hier.
Das Programm verwendet den Output des Tokenizers von Toni Arnold. Aus den
verschiedenen zur Verfügung stehenden Output-Formaten wurde dasjenige
gewählt, welches den Input-Text in Sätze zerlegt liefert. Der
Output wurde manuell geprüft und korrigiert. Unser Übersetzungssystem
arbeitet also mit einem "idealisierten" Tokenizer-Output.
Auch in Bezug auf
das Lexikon haben wir uns für eine "Ideallösung" entschieden.
Das Lexikon ist auf den Text abgestimmt, das heisst, dass einerseits alle
im Text vorkommenden Wortformen im Lexikon enthalten sind und dass andererseits
bei der Aufnahme von Mehrdeutigkeiten nur eine Auswahl getroffen wurde.
Beim verwendeten Lexikon handelt es sich um ein Vollformenlexikon: Aufgelistet
sind im Lexikon die konkreten, im Text vorkommenden Wortformen zusammen
mit den ihnen in Bezug auf die morphosyntaktischen Merkmale entsprechenden
englischen Wortformen.
Dank dem Entscheid
für ein Vollformenlexikon war es möglich, die Probleme, welche
sich bei der Reduzierung der Wortformen auf die Grundformen ergeben, zu
eliminieren.
Zurück zur Startseite
* * *