Das Wort-für-Wort Übersetzungssystem

Unser Wort-für-Wort-Übersetzungssystem ist in Prolog geschrieben. Den Programmcode findest Du hier. Das Programm verwendet den Output des Tokenizers von Toni Arnold. Aus den verschiedenen zur Verfügung stehenden Output-Formaten wurde dasjenige gewählt, welches den Input-Text in Sätze zerlegt liefert. Der Output wurde manuell geprüft und korrigiert. Unser Übersetzungssystem arbeitet also mit einem "idealisierten" Tokenizer-Output.
Auch in Bezug auf das Lexikon haben wir uns für eine "Ideallösung" entschieden. Das Lexikon ist auf den Text abgestimmt, das heisst, dass einerseits alle im Text vorkommenden Wortformen im Lexikon enthalten sind und dass andererseits bei der Aufnahme von Mehrdeutigkeiten nur eine Auswahl getroffen wurde. Beim verwendeten Lexikon handelt es sich um ein Vollformenlexikon: Aufgelistet sind im Lexikon die konkreten, im Text vorkommenden Wortformen zusammen mit den ihnen in Bezug auf die morphosyntaktischen Merkmale entsprechenden englischen Wortformen.
Dank dem Entscheid für ein Vollformenlexikon war es möglich, die Probleme, welche sich bei der Reduzierung der Wortformen auf die Grundformen ergeben, zu eliminieren.

Zurück zur Startseite

* * *