3.3. STTS
Stuttgart/Tübingen-Tagset (STTS)
- http://www.cl.uzh.ch/clab/hilfe/stts/
- Das Standard-Tagset des Deutschen [SCHILLER et al. 1999] (vergleichbar mit dem
Penn-Treebank-Tagset für Englisch)
- Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTS
annotiert. ▸▸▸
- Frei verfügbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannte
“Tagger”) liefern mit STTS-Tags versehenen Output.
- Eine Notationsvariante von STTS ist als europäischer Standard für Deutsch (EAGLES
ELM-DE) [EAGLES 1996] spezifiziert worden.
- Alternativen: Münsteraner Tagset [STEINER 2003]
Besonderheiten von STTS
- ‘Wortarten’ für satzinterne und -finale Interpunktion
- Kategorie für fremdsprachliches Material (FM)
- Feine Aufgliederung bei Partikeln
- Durchgängige Unterscheidung von attribuierend (Begleiter) vs. substituierend (Pronomen)
- Eigennamen sind eine semantisch definierte Klasse.
QUIZ zu Wortarten
Wo stecken in den folgenden Sätzen besondere Schwierigkeiten? Wieso?
Er kannte ihn schon als kleines Kind.
Die Wissenschaft selbst ist ein kompliziertes System.
Ich habe noch nie solch eine Geschichte gehört.
Er ist erkrankt.
Auf der einen Seite ist es so, aber ...
Der Mann, von dessen Vater das Buch handelt, ist ...
Er kam plötzlich und ohne anzuklopfen herein.
Er wartete bis um 5 Uhr.