15.3.  Evaluation

Segment- und Klassifikationsfehler

Mangelhafte Segmentierung (noise)

Falsche Klassifikation

15.3.1.  Kommerzielle Tools

Beispiel einer monolingualen TE-Evaluation
Vergleichende Studie von 3 kommerziellen TE-Tools [FLEISCHMANN 2002]

Noise und seine Beseitigung

Manuelle Validierung


pict

Abbildung 15.3: Evaluation der Präzision

Aufwand

Silence und der Umgang damit

Manuelle Validierung der Vollständigkeit

würde die Verwendung von TE-Tools ad absurdum führen.

Stichproben

Studie: Menschlicher Annotator extrahiert während 1h Termini (ca. 20 Seiten Text)

Pragmatische Kompromisse

Benutzer sollte den Grad an Noise bzw. Silence parametrisieren können.


pict

Abbildung 15.4: Slider von Trados ExtraTerm


pict

Abbildung 15.5: Wieviele Termini der Stichprobe wurden übersehen?


Evaluationen evaluieren (d.h. bewerten)
Wie objektiv sind solche Evaluationen?

Weitere Kriterien für Nützlichkeit von TE-Tools

Validierungsprozess, Sprachunterstützung, Datenaustausch, Benutzfreundlichkeit, Parametrisierbarkeit, Mehrsprachigkeit, Arbeitsablauf