Morphologie, Lemmatisierung und Wortartenklassifikationen

Morphologieanalyse und Lexikonaufbau (1. Vorlesung)

Dozent: Martin Volk

Übersicht


Was ist Morphologie?

Morphologie (in der Sprachwissenschaft) ist die Lehre von

Ziele der morphologischen Analyse (nach [Bußmann 83])

  1. Gewinnung von Kriterien zur Bestimmung der Wortarten
  2. Beschreibung der Regularitäten der Flexion
  3. die Untersuchung von grammatischen Kategorien wie Tempus, Modus und ihre sprachl. Entsprechungen
  4. bei der Wortbildung die Untersuchung der Basiselemente, Kombinationsprinzipien und semantischen Funktionen von Wortneubildung

Was ist ein Wort?

Beispielsatz

Er sah sich die 5 Ein- und Ausgaben des MS-Word-Programms an.

Wieviele Wörter kommen in diesem Satz vor?

SPIEGEL (13.3.95):

Jahrelang wurde in den IDG-internen Info-Briefen der Konkurrent
unter dem Kürzel ZD argwöhnisch verfolgt, der von William Ziff sen.
schon 1927 mit Special-Interest-Titeln für Flieger, Ski- und Autofahrer
gegründet worden war.

Wort: "Intuitiv vorgegebener und umgangssprachlich verwendeter Begriff für sprachliche Grundeinheiten." (nach Bußmann)

  1. auf phonetisch-phonologischer Ebene: Wort ist kleinste durch Wortakzent und Grenzsignale wie Pause, Knacklaut u.a. theoretisch isolierbares Lautsegment.
  2. auf orthographisch-graphemischer Ebene: Wort ist durch Leerstellen im Schriftbild isoliert
  3. auf morphologischer Ebene: Wort ist die Grundeinheit eines grammatischen Paradigmas wie Flexion (i. Ggsatz zu Wortform)
  4. auf lexikalisch-semantischer Ebene: Wort ist kleinster selbständiger Träger von Bedeutung
  5. auf syntaktischer Ebene: kleinste verschiebbare und ersetzbare Einheit eines Satzes

Was ist ein Lemma?

nach Bußmann: Eintrag bzw. einzelnes Stichwort in einem Lexikon

nach Metzler ('Lexikon Sprache'): Repräsentant eines Lexems, zu dem in einem Wörterbuch Sprach- und Sachinformationen geboten werden.

allgemein in der CL: normierte Grundform für alle zu einem Wort gehörenden Wortformen

Was ist Lemmatisierung?

Rückführung einer Wortform auf ihr Lemma

(oft nicht eindeutig möglich: Bsp. rasten )

Was ist ein Morphem?

kleinste bedeutungstragende Einheit (oder: kleinste lexikalisch definierte Einheiten, aus denen ein Wort zusammengesetzt ist); Bsp.:

(vgl. Vorlesung 2)


Wortarten-Klassifikation

Historische Entwicklung der Wortarteneinteilung

Plato

400 v.Chr.

Aristoteles

350 v. Chr.

Stoiker

250 v. Chr.

Dion. Thrax

100 v. Chr.

heute
onoma onoma onoma onoma Nomen
prosegoria Eigenname
mesotes epirrhema Adverb
rhema rhema rhema rhema Verb
metoche Partizip
syndesmoi arthra arthron Artikel
antonymia Pronomen
syndesmos prothesis Präposition
syndesmos Konjunktion

Wortarten nach `Thomas von Erfurt'

(spätes Mittelalter; nach R.H.Robins 'A short history of linguistics': S.89)

nomen:
ein Wort, das etwas Beständiges oder Permanentes bezeichnet, oder etwas mit unterscheidenden Eigenschaften (distinctive characteristics)
verbum:
ein Wort, das den zeitlichen Vorgang bezeichnet, losgelöst von einer Substanz (die es jedoch beschreibt)
participium:
ein Wort, das den zeitlichen Vorgang bezeichnet, jedoch nicht losgelöst von einer Substanz (die es beschreibt)
pronomen:
ein Wort, das etwas Beständiges oder Permanentes bezeichnet, ohne unterscheidende Eigenschaften (distinctive characteristics)
adverbium:
ein Wort, das zusammen steht mit einem Wort, das den zeitlichen Vorgang bezeichnet und diesen weiter bestimmt
conjunctio:
ein Wort, das den Zusammenschluss zweier anderer Terme bezeichnet
praepositio:
ein Wort, das eine syntaktische Konstruktion aufbaut mit einem Kasus-flektierten Wort, und dieses mit einer Handlung verbindet
interiectio:
ein Wort, das ein Verb oder Partizip näher bestimmt und Gefühle ausdrückt

Wortarten in der Duden-Grammatik:

(4. Auflage 1984 S. 88; vgl. dort auch Tabelle auf S. 91 und in [Duden 95] S. 88)

Def.: Auf Grund der unterschiedlichen Funktionen im Satz und der damit eng verknüpften Formmerkmale, Anordnung und Beziehungen zueinander können verschiedene Gruppen oder Klassen von Wörtern unterschieden werden, die sich auch semantisch voneinander abgrenzen lassen und die man Wortarten nennt.

Verben
(Mit Verben wird das Prädikat des Satzes gebildet, weshalb sie konjugierbar sind. Mit Verben bezeichnet der Sprecher, was geschieht oder was ist: Zustände (wohnen), Vorgänge (verblühen), Tätigkeiten und Handlungen (bauen).)
Substantive
Adjektive
Begleiter und Stellvertreter des Substantivs
Artikel
  • sind deklinierbar (in Kasus, Numerus, Genus)
  • werden nur in Verbindung mit einem Substantiv gebraucht
  • Beispiele: der, den, eine, einen
Pronomen
  • sind deklinierbar (in Kasus, Numerus, Genus, teilw. Person)
  • werden nur in Verbindung mit einem Substantiv oder als Stellvertreter eines Substantivs gebraucht
  • Beispiele: ich, mein, dieser, sich, niemand
Partikel
sind nicht veränderbar
Adverben
Umstandsangabe oder Attribut (Bsp.: bald, sehr, fast, abends, probeweise)
Konjunktionen
verbinden Wörter oder Wortgruppen (Bsp.: und, weil, dass)
Präpositionen
  • bestimmen Kasus des zug. Substantivs
  • bezeichnen Verhältnisse oder Beziehungen
  • Beispiele: auf, wegen, seit, jenseits
Interjektionen

Aufgabe: Wie sollten die folgenden Wörter eingeordnet werden?

Er kannte ihn schon als kleines Kind.
Die Wissenschaft selbst ist ein kompliziertes System.
Ich habe noch nie solch eine Geschichte gehört.
Er ist erkrankt.
Auf der einen Seite ist es so, aber ...
Er stellt zuviele Fragen.
Der Mann, von dessen Vater das Buch handelt, ist ...
Er kam plötzlich und ohne anzuklopfen herein.
Er wartete bis um 5 Uhr.


Wortarteneinteilung in Morphix

(nach [Finkler und Neumann 86])


Wortarteneinteilung im STTS

Das folgende Tagset ist das ``Stuttgart/Tübingen TagSet'' (STTS), das von Anne Schiller, Christine Thielen, Simone Teufel und Christine Stöckert in den Jahren 94-95 entwickelt wurde.

Siehe auch: Tagging-Guidelines etc.

  1. Adjektive
    ADJA    attributives Adjektiv                   [das] große [Haus]
    ADJD    adverbiales oder                        [er fährt] schnell 
            prädikatives Adjektiv                   [er ist] schnell 
    
  2. Adverbien
    ADV     Adverb                                  schon, bald, doch 
    
  3. Adpositionen
    APPR    Präposition; Zirkumposition links       in [der Stadt], ohne [mich]
    APPRART Präposition mit Artikel                 im [Haus], zur [Sache]
    APPO    Postposition                            [ihm] zufolge, [der Sache] wegen
    APZR    Zirkumposition rechts                   [von jetzt] an
    
  4. Artikel
    ART     bestimmter oder                         der, die, das, 
            unbestimmter Artikel                    ein, eine, ...
    
  5. Zahlen
    CARD    Kardinalzahl                            zwei [Männer], [im Jahre] 1994
    ORD     Ordinalzahl                             [der] neunte [August]
    
  6. Konjunktionen
    KOUI    unterordnende Konjunktion               um [zu leben],
            mit ``zu'' und Infinitiv                anstatt [zu fragen]
    KOUS    unterordnende Konjunktion               weil, daß, damit,
            mit Satz                                wenn, ob
    KON     nebenordnende Konjunktion               und, oder, aber
    KOKOM   Vergleichskonjunktion                   als, wie 
    
  7. Substantive
    NN      normales Nomen                          Tisch, Herr, [das] Reisen
    NE      Eigennamen                              Hans, Hamburg, HSV
    
  8. Pronomen
    PDS     substituierendes Demonstrativ-          dieser, jener
            pronomen
    PDAT    attribuierendes Demonstrativ-           jener [Mensch]
            pronomen
    
    PIS     substituierendes Indefinit-             keiner, viele, man, niemand
            pronomen
    PIAT    attribuierendes Indefinit-              kein [Mensch],
            pronomen ohne Determiner                irgendein [Glas]
    PIDAT   attribuierendes Indefinit-              [ein] wenig [Wasser],
            pronomen mit Determiner                 [die] beiden [Brüder]
    
    PPER    irreflexives Personalpronomen           ich, er, ihm, mich, dir
    
    PPOSS   substituierendes Possessiv-             meins, deiner
            pronomen
    PPOSAT  attribuierendes Possessivpronomen       mein [Buch], deine [Mutter]
    
    PRELS   substituierendes Relativpronomen        [der Hund ,] der
    PRELAT  attribuierendes Relativpronomen         [der Mann ,] dessen [Hund]
    
    PRF     reflexives Personalpronomen             sich, einander, dich, mir
     
    PWS     substituierendes                        wer, was 
            Interrogativpronomen
    PWAT    attribuierendes                         welche [Farbe],
            Interrogativpronomen                    wessen [Hut]
    PWAV    adverbiales Interrogativ-               warum, wo, wann,
            oder Relativpronomen                    worüber, wobei
    
    PAV     Pronominaladverb                        dafür, dabei, deswegen, trotzdem
    
  9. Partikel
    PTKZU   ``zu'' vor Infinitiv                    zu [gehen]
    PTKNEG  Negationspartikel                       nicht
    PTKVZ   abgetrennter Verbzusatz                 [er kommt] an, [er fährt] rad
    PTKANT  Antwortpartikel                         ja, nein, danke, bitte
    PTKA    Partikel bei Adjektiv                   am [schönsten],
            oder Adverb                             zu [schnell]
    
  10. Verben
    VVFIN   finites Verb, voll                      [du] gehst, [wir] kommen [an]
    VVIMP   Imperativ, voll                         komm [!] 
    VVINF   Infinitiv, voll                         gehen, ankommen 
    VVIZU   Infinitiv mit ``zu'', voll              anzukommen, loszulassen 
    VVPP    Partizip Perfekt, voll                  gegangen, angekommen 
    VAFIN   finites Verb, aux                       [du] bist, [wir] werden 
    VAIMP   Imperativ, aux                          sei [ruhig !]
    VAINF   Infinitiv, aux                          werden, sein 
    VAPP    Partizip Perfekt, aux                   gewesen 
    VMFIN   finites Verb, modal                     dürfen
    VMINF   Infinitiv, modal                        wollen 
    VMPP    Partizip Perfekt, modal                 gekonnt, [er hat gehen] können 
    
  11. Sonstiges
     
    XY      Nichtwort, Sonderzeichen                3:7, H2O,
            enthaltend                              D2XW3 
    
    FM      Fremdsprachliches Material              [Er hat das mit ``]
                                                    A big fish ['' übersetzt] 
    SGML    SGML Markup                             <turnid=n022k_TS2004>
    
    SPELL   Buchstabierfolge                        S-C-H-W-E-I-K-L
    
    TRUNC   Kompositions-Erstglied                  An- [und Abreise]
    
    ITJ     Interjektion                            mhm, ach, tja 
     
    $,     Komma                                   ,
    $.     Satzbeendende Interpunktion             . ? ! ; :
    $(     sonstige Satzzeichen; satzintern        - [,]()
    

Zusammenfassung

  1. Der Begriff 'Wort' ist ungenau und muss je nach Anwendung definiert werden.
  2. Wichtige, gut definierte Begriffe sind 'Lemma' und 'Morphem'.
  3. Die Wortarteneinteilung kann nach sehr unterschiedlichen Kriterien geschehen. Dazu gehören morphologische Kriterien (Flektierbarkeit, Komparierbarkeit), syntaktische Kriterien(Funktion, Distribution), semantische Kriterien (semantische Kategorien wie Zustand, Vorgang; Lebewesen, Ding, Abstraktum etc.) und pragmatische Kriterien (z.B. Sprecher-Einstellungen).
  4. Probleme bei der Wortarteneinteilung entstehen z.B. durch:

Martin Volk
Date of last modification:
Source: http://www.ifi.unizh.ch