[ Weiter ] [ Zurück ] [ Zurück (Seitenende) ] [ Seitenende ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]
Identifiziere spezifisch fachsprachliche Wortbestandteile!
Diskussion
Identifiziere Termkandidaten anhand der Wortarten!
Sprachspezifische Wortgruppenmuster für Nominalphrasen
Probleme
Bilinguale Termextraktion à la Xerox Termfinder
Problem und Ausweg
Exkurs Chamblon TerminologyExtractor
Monolinguale Termextraktion für Englisch/Französisch
|
Quantitative Methoden der TE I
Identifiziere Termkandidaten wegen deren abweichenden Vorkommenshäufigkeit!
Idee
Fachwörter kommen in Fachtexten (SL) häufiger vor als in allgemeinen Texten (GL).
Bedingungen
Idee
Fachwörter treten nur in bestimmten Dokumenten auf – dort aber gehäuft!
Fachbegriffe als gute Dokumentdeskriptoren
Zwei wichtige Masse aus dem Information Retrieval zur Quantifizierung der inhaltlichen Relevanz von Wörtern für ein bestimmtes Dokument lassen sich verwenden:
Mehrteilige Termkandidaten identifizieren
Idee der hohen Assoziationsstärke
Bestandteile von Termini treten auffällig häufig miteinander auf!
Kontingenztabelle
Gezählt wird über allen Wortgruppen.
Assoziationsmass
SMC (Simple Matching Coefficient) ist einfach und brauchbar. Viele weitere Masse!
Bilinguales Zuordnen von Kandidaten (term alignment)
Ansatz nach [VINTAR 2002]
Probleme
Beispiel für Zuordnung nach Vintar
|
Bilinguale Termextraktion im Kontext von CAT-Systemen zur technischen Redaktion
Bilinguale Termextraktion für Informationssuche
CLIR (cross language information retrieval)
Monolinguale Terminologieextraktion
bleibt schwierig: Professionalisierung, Outsourcing
Verbesserte hybride Ansätze
Nutzen bestehender terminologischer Bestände
Intelligente Integration von elektronisch verfügbaren Ressourcen: Terminologien, translation memories, Thesauri, Ontologien.
[ Weiter ] [ Zurück ] [ Zurück (Seitenende) ] [ Seitenbeginn ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]