Automatische Termextraktion
Unterlagen, Literaturhinweise und Hintergrundinformation zum Referat vom 13.3.2004
- Folienskript (Folie 19 korrigiert am 5.5.04)
- Beispiel zur Termvariation (auf Seite5)
- Zitierte Evaluation von K. Fleischmann
- Angesprochende kommerzielle TE-Produkte
- Weirdness bei SystemQuirk
- Untersuchung von M. Volk, A.-K. Pantli und A. Malka zum Verbessern von Xerox TermFinder Termkandidatenpaarlisten
- Michael P. Oakes, Statistics for corpus linguistics, Edinburgh University Press, 1998: Abschnitt 4.3.2 zum Thema "Masse für Assoziationsstärke"
- Probabilistisches Lexikon (TWENTE), sowie Talk von S. Vintar mit statistischem Verfahren zur bilingualen Termextraktion
- Link zur ATA 43 Konferenz mit der Anforderungsspezifikation für "terminologiebewusste" Übersetzungssoftware
Links
Umfrage unter Teilnehmenden vor dem Vortrag:
"Was wäre für Sie das nützlichste Merkmal einer automatischen Extraktion von Termen?"
- Möglichst schnell und unkompliziert in der Anwendung (Zeitersparnis)
- Erkennung und Extraktion von mehrteiligen Termini
- Erkennung von Termini, die noch nicht in einer Termdatenbank sind
- Erkennung von Termini, welche schon in Termdatenbank erfasst sind, zur erleichterten Suche von Äquivalenten für die Übersetzung
- Herausgefilterte Fachtermini in die nützliche terminologische Form bringen
- Vergleich mit bereits bestehender Datenbank
- Einfach Handhabung
- Kompatibilität mit Industrie-Standard-Software
- Möglichst reibungslose Extraktion möglichst vieler Termini
- Zeitersparnis
- Extraktion von Termini (welche exakte Äquivalenzen repräsentieren)aus Paralleltexten, möglichst ohne vorherige Sementierung des Zieltextes