Morphologieanalyse und Lexikonaufbau (1. Vorlesung)
Dozent: Gerold Schneider
Morphologie (in der Sprachwissenschaft) ist die Lehre von
Ziele der morphologischen Analyse (nach [Bußmann 83])
Abgesehen vom theoretischen Interesse an Morphologie könnte man sich in der Praxis CL Anwendungen vorstellen, die ohne Morphologieanalyse auskommen. Ein syntaktischer Parser beispielsweise kann jede Wortform wie sie im Text erscheint in einem Vollformenlexikon nachschlagen. Wie z.B. [Sproat 92], pp. xi-xv betont wäre dies aber nicht nur unelegant:
Beispielsatz
Er sah sich die 5 Ein- und Ausgaben des MS-Word-Programms an.
Wieviele Wörter kommen in diesem Satz vor?
SPIEGEL (13.3.95):
Jahrelang wurde in den IDG-internen Info-Briefen der Konkurrent unter dem Kürzel ZD argwöhnisch verfolgt, der von William Ziff sen. schon 1927 mit Special-Interest-Titeln für Flieger, Ski- und Autofahrer gegründet worden war.
Wort: "Intuitiv vorgegebener und umgangssprachlich verwendeter Begriff für sprachliche Grundeinheiten." (nach Bußmann)
nach Bußmann: Eintrag bzw. einzelnes Stichwort in einem Lexikon
nach Metzler ('Lexikon Sprache'): Repräsentant eines Lexems, zu dem in einem Wörterbuch Sprach- und Sachinformationen geboten werden.
allgemein in der CL: normierte Grundform für alle zu einem Wort gehörenden Wortformen
Rückführung einer Wortform auf ihr Lemma
(oft nicht eindeutig möglich: Bsp. rasten )
kleinste bedeutungstragende Einheit (oder: kleinste lexikalisch definierte Einheiten, aus denen ein Wort zusammengesetzt ist); Bsp.:
(vgl. Vorlesung 2)
siehe [Trask 99] für eine Einführung
Plato 400 v.Chr. |
Aristoteles 350 v. Chr. |
Stoiker 250 v. Chr. |
Dion. Thrax 100 v. Chr. |
heute |
onoma |
onoma |
onoma |
onoma |
Nomen |
|
|
prosegoria |
|
Eigenname |
|
|
mesotes |
epirrhema |
Adverb |
rhema |
rhema |
rhema |
rhema |
Verb |
|
|
|
metoche |
Partizip |
|
syndesmoi |
arthra |
arthron |
Artikel |
|
|
|
antonymia |
Pronomen |
|
|
syndesmos |
prothesis |
Präposition |
|
|
|
syndesmos |
Konjunktion |
(spätes Mittelalter; nach [Robins 90] S.89)
Die klassische englische Einteilung stammt vom amerikanischen Linguisten Murray aus dem Jahr 1795. Sie basiert auf den Gegebenheiten der englischen Sprache und nicht mehr hauptsächlich auf Latein, was zwei Änderungen bewirkt:
Ihre 8-fache Grundeinteilung wurde und wird von sämtlichen englischen Schulgrammatiken befolgt:
Nomen, Verb, Adjektiv, Adverb, Pronomen, Präposition, Konjunktion, Interjektion.
(4. Auflage 1984 S. 88; vgl. dort auch Tabelle auf S. 91 und in [Duden 95] S. 88)
Def.: Auf Grund der unterschiedlichen Funktionen im Satz und der damit eng verknüpften Formmerkmale, Anordnung und Beziehungen zueinander können verschiedene Gruppen oder Klassen von Wörtern unterschieden werden, die sich auch semantisch voneinander abgrenzen lassen und die man Wortarten nennt.
Aufgabe: Wie sollten die folgenden Wörter eingeordnet werden?
Er kannte ihn schon als kleines Kind. Die Wissenschaft selbst ist ein kompliziertes System. Ich habe noch nie solch eine Geschichte gehört. Sie ist erkrankt. Auf der einen Seite ist es so, aber ... Er stellt zuviele Fragen. Der Mann, von dessen Vater das Buch handelt, ist ... Er kam plötzlich und ohne anzuklopfen herein. Er wartete bis um 5 Uhr. Sie ass die Suppe auf.
Es gibt manchmal, je nach Argumentation, verschiedene Einteilungsmöglichkeiten. Wortarteneinteilung ist also auch eine Frage der Kriterien, der Konvention und der Objektsprache. Einteilungskriterien sind :
Nicht alle Wortarten kommen in jeder Sprache vor. z.B. Postpositionen gibt es im Englischen den meisten Grammatiken zufolge keine (allenfalls aist go die einzige (!) Postposition) während Türkisch, Baskisch, Japanisch sehr viele Postpositionen haben. Im Deutschen gibt es wenige Postpositionen (der Grammatik zufolge, der Sache wegen) und die in vielen Sprachen (z.B. Englisch) völlig unbekannten Zirkumpositionen (um etwas herum, von morgen an). Einzig die Wortarten Nomen und Verb werden von den meisten Linguisten als universell angesehen (siehe Plato oben, 400 v. Chr.).
(nach [Finkler und Neumann 86])
Das folgende Tagset ist das ``Stuttgart/Tübingen TagSet'' (STTS), das von Anne Schiller, Christine Thielen, Simone Teufel und Christine Stöckert in den Jahren 94-95 entwickelt wurde.
Siehe auch: Tagging-Guidelines etc.
ADJA attributives Adjektiv [das] große [Haus] ADJD adverbiales oder [er fährt] schnell prädikatives Adjektiv [er ist] schnell
ADV Adverb schon, bald, doch
APPR Präposition; Zirkumposition links in [der Stadt], ohne [mich] APPRART Präposition mit Artikel im [Haus], zur [Sache] APPO Postposition [ihm] zufolge, [der Sache] wegen APZR Zirkumposition rechts [von jetzt] an
ART bestimmter oder der, die, das, unbestimmter Artikel ein, eine, ...
CARD Kardinalzahl zwei [Männer], [im Jahre] 1994 ORD Ordinalzahl [der] neunte [August]
KOUI unterordnende Konjunktion um [zu leben], mit ``zu'' und Infinitiv anstatt [zu fragen] KOUS unterordnende Konjunktion weil, daß, damit, mit Satz wenn, ob KON nebenordnende Konjunktion und, oder, aber KOKOM Vergleichskonjunktion als, wie
NN normales Nomen Tisch, Herr, [das] Reisen NE Eigennamen Hans, Hamburg, HSV
PDS substituierendes Demonstrativ- dieser, jener pronomen PDAT attribuierendes Demonstrativ- jener [Mensch] pronomen PIS substituierendes Indefinit- keiner, viele, man, niemand pronomen PIAT attribuierendes Indefinit- kein [Mensch], pronomen ohne Determiner irgendein [Glas] PIDAT attribuierendes Indefinit- [ein] wenig [Wasser], pronomen mit Determiner [die] beiden [Brüder] PPER irreflexives Personalpronomen ich, er, ihm, mich, dir PPOSS substituierendes Possessiv- meins, deiner pronomen PPOSAT attribuierendes Possessivpronomen mein [Buch], deine [Mutter] PRELS substituierendes Relativpronomen [der Hund ,] der PRELAT attribuierendes Relativpronomen [der Mann ,] dessen [Hund] PRF reflexives Personalpronomen sich, einander, dich, mir PWS substituierendes wer, was Interrogativpronomen PWAT attribuierendes welche [Farbe], Interrogativpronomen wessen [Hut] PWAV adverbiales Interrogativ- warum, wo, wann, oder Relativpronomen worüber, wobei PAV Pronominaladverb dafür, dabei, deswegen, trotzdem
PTKZU ``zu'' vor Infinitiv zu [gehen] PTKNEG Negationspartikel nicht PTKVZ abgetrennter Verbzusatz [er kommt] an, [er fährt] rad PTKANT Antwortpartikel ja, nein, danke, bitte PTKA Partikel bei Adjektiv am [schönsten], oder Adverb zu [schnell]
VVFIN finites Verb, voll [du] gehst, [wir] kommen [an] VVIMP Imperativ, voll komm [!] VVINF Infinitiv, voll gehen, ankommen VVIZU Infinitiv mit ``zu'', voll anzukommen, loszulassen VVPP Partizip Perfekt, voll gegangen, angekommen VAFIN finites Verb, aux [du] bist, [wir] werden VAIMP Imperativ, aux sei [ruhig !] VAINF Infinitiv, aux werden, sein VAPP Partizip Perfekt, aux gewesen VMFIN finites Verb, modal dürfen VMINF Infinitiv, modal wollen VMPP Partizip Perfekt, modal gekonnt, [er hat gehen] können
XY Nichtwort, Sonderzeichen 3:7, H2O, enthaltend D2XW3 FM Fremdsprachliches Material [Er hat das mit ``] A big fish ['' übersetzt] SGML SGML Markup <turnid=n022k_TS2004> SPELL Buchstabierfolge S-C-H-W-E-I-K-L TRUNC Kompositions-Erstglied An- [und Abreise] ITJ Interjektion mhm, ach, tja $, Komma , $. Satzbeendende Interpunktion . ? ! ; : $( sonstige Satzzeichen; satzintern - [,]()