Hinweis: Originalversion des Berichts! Lediglich Hyperlinks und einige wenige Formatierungen wurden hinzugefügt. Zu Gertwol gibt es auch eine Online-Demoversion. Dieser Bericht bildet die Grundlage der 4. Vorlesung `Lexikonaufbau und Morphologieanalyse' an der Universität Zürich im Sommersemester 1999. (Dozent: Gerold Schneider)
Mariikka Haapalainen Ari Majorin Lingsoft, Inc. September 1994 1. EINLEITUNG......................................................... 2. GERTWOL............................................................. 2.1. ALLGEMEINES............................................... 2.2. FLEXION................................................... 2.2.1. Flektierende Wortarten 2.2.1.1. Verben 2.2.1.2. Substantive 2.2.1.3. Adjektive 2.2.1.4. Pronomina 2.2.1.5. Artikel 2.2.1.6. Numeralien 2.2.1.7. Eigennamen 2.2.2. Nicht-flektierende Wortarten 2.3. DERIVATION............................................... 2.3.1. Präfigierung 2.3.1.1. Präfigierung von Verben 2.3.1.2. Präfigierung von Substantiven 2.3.1.3. Präfigierung von Adjektiven 2.3.2. Suffigierung 2.3.2.1. Derivation ersten Grades 2.3.2.2. Syntagmatische Derivation 2.3.2.3. Paradigmatische Derivation 2.3.3. Konversion 2.4. KOMPOSITION.............................................. 2.4.1. Nomen-Nomen-Komposita 2.4.2. Andere Komposita 2.4.2.1. Substantivisches Zweitglied 2.4.2.2. Adjektivisches Zweitglied 2.5. SEGMENTIERUNG VON WORTFORMEN............................. 2.5.1. Allgemeines 2.5.2. Schwache vs. starke Kompositionsgrenze 2.5.3. Fugenelemente 2.5.4. Suffixe 2.5.4.1. Substantivische Suffixe 2.5.4.2. Adjektivische Suffixe 2.5.4.3. Adverbiale Suffixe 2.5.4.4. Verbale Suffixe 2.6. DIE WICHTIGSTEN TWOL-REGELN.............................. 3. SCHLUSSBEMERKUNGEN................................................. LITERATURVERZEICHNIS................................................... GERTWOL-TAGSET......................................................... 1. EINLEITUNG GERTWOL ist ein System zur automatischen Wortformerkennung deutscher Wörter. Die theoretische Grundlage des GERTWOL-Programms ist die sprachunabhängige morphologische Analysemethode "Zwei-Ebenen-Modell" von Prof. Dr. Kimmo Koskenniemi (TWOL, Two-Level-Morphologie, two-level model 1983). Die Zwei-Ebenen-Morphologie (TWOL) behandelt morphologische Phänomene auf zwei Ebenen; auf der lexikalischen Ebene und auf der Oberflächenebene. Einem Zeichen auf der lexikalischen Ebene entspricht ein Zeichen -- möglicherweise ein Nullzeichen -- auf der Oberflächenebene. Dies ermöglicht mit der gleichen Effizienz sowohl die Analyse als auch die Generierung von Wortformen. Die Hauptmittel von TWOL sind Fortsetzungsklassen und TWOL-Regeln. In den Fortsetzungsklassen bekommen die Wörter Flexionsendungen. Die TWOL-Regeln stellen ein bestimmtes Kontext fest, in dem einem Zeichen der lexikalischen Ebene ein Zeichen der Oberflächenebene entsprechen kann oder muß. Das Alphabet von TWOL besteht neben den Buchstaben und Sonderzeichen auch von diakritischen Zeichen, die die Funktion von TWOL-Regeln steuern. Bis heute ist das TWOL-System für etwa 30 Sprachen verwendet worden. 2. GERTWOL 2.1. ALLGEMEINES Das Grundlexikon von GERTWOL ist das komplette Sprachmaterial des Deutsch-Englischen Wörterbuchs von Collins (THE COLLINS GERMAN DICTIONARY, Neubearbeitung 1991, Copyright HarperCollins Publishers). Das Wortmaterial des CGD-Lexikons wurde aber deutlich vervollständigt, als GERTWOL Tests an unterschiedlichen Korpora unterzogen wurde. Es wurden z. B. über 6300 Substantive und ca. 11 000 Eigennamen hinzugefügt. Die etwaigen Gesamtzahlen der Lexeme verteilen sich heute (Stand: Sept. 1994) bei einzelnen Wortarten folgendermaßen: 11 000 Adjektive 2 000 Adverbien 400 Interjektionen 50 000 Substantive 6 500 Verben 12 000 Eigennamen 1 700 Abkürzungen Wenn auch die geschlossenen Wortarten Konjunktionen, Pronomina, Artikel und Präpositionen mitgerechnet werden, verfügt GERTWOL über ein Wortformenlexikon von etwa 85 000 Wortformen, deren Geltungsbereich durch eine umfassende Derivationsmorphologie und einen vollständigen Mechanismus zur Kompositabildung erheblich erweitert wird. GERTWOL gibt die möglichen Lesungen einer deutschen Wortform an. Die Lesungen bestehen aus der Grundform des Wortes und aus morphologischen Daten zur Wortform. Wortform Lesung: "Grundform" + morphologische Analyse Lesung: "Grundform" + morphologische Analyse etc. Beispielsatz: -GERTWOL "*g*e*r*t*w*o*l" ABK S EIGEN -ist "sein" V IND PRÄS SG3 -ein "ein" PRÄF "ein" ADV "ein" NUM KARD "einen" V IMP PRÄS GESPROCHEN SG2 "ein" ART INDEF SG AKK NEUTR "ein" ART INDEF SG NOM NEUTR "ein" ART INDEF SG NOM MASK -System "*system" S NEUTR SG DAT "*system" S NEUTR SG AKK "*system" S NEUTR SG NOM -zur "zu-die" PRÄP ART DEF SG DAT FEM -automatischen "automat~isch" A POS PL GEN "automat~isch" A POS PL AKK "automat~isch" A POS PL NOM "automat~isch" A POS SG GEN FEM "automat~isch" A POS SG DAT FEM "automat~isch" A POS SG DAT NEUTR "automat~isch" A POS SG DAT MASK "automat~isch" A POS PL DAT "automat~isch" A POS SG GEN NEUTR "automat~isch" A POS SG GEN MASK "automat~isch" A POS SG AKK MASK -Wortformerkennung "*wort#form~er#kenn~ung" S FEM SG GEN "*wort#form~er#kenn~ung" S FEM SG DAT "*wort#form~er#kenn~ung" S FEM SG AKK "*wort#form~er#kenn~ung" S FEM SG NOM "*wort#form#er|kenn~ung" S FEM SG GEN "*wort#form#er|kenn~ung" S FEM SG DAT "*wort#form#er|kenn~ung" S FEM SG AKK "*wort#form#er|kenn~ung" S FEM SG NOM -deutscher "deutsch" A KOMP "deutsch" A POS PL GEN "deutsch" A POS SG GEN FEM "deutsch" A POS SG DAT FEM "deutsch" A POS SG NOM MASK -Wörter "*wort" S NEUTR PL GEN "*wort" S NEUTR PL AKK "*wort" S NEUTR PL NOM . PUNKT Eine Version von GERTWOL generiert Wortformen. Es wird dabei die Grundform mit den erwünschten morphologischen Daten eingegeben. Auf Grund dieser Angaben generiert GERTWOL die den Angaben entsprechende Wortform. Beispiele: lernen+v+ind+präs+sg3 --> lernt gut+a+komp+sg+akk+neutr --> besseres *buch+s+neutr+pl+dat --> *büchern GERTWOL ist an unterschiedlichen Korpora, u.a. an Zeitungstexten, Gesetzestexten, Wetterberichten, literarischen Texten und Geschäftsberichten getestet worden und erreicht heute (Stand: Sept. 1994) eine Datenabdeckung von über 99 % bei ortographisch einwandfreien Texten und über 98 % bei unbeschränkten Texten. Die Erkennungsraten von GERTWOL sind in SUN SPARCstation 2 etwa 200 Wortformen/Sekunde als morphologischer Analysator und etwa 700 W/S bei Wortformerkennung ohne morphologische Analyse. GERTWOL kann z. B. in Textanalyse, Ortographie-Korrektur und Information-Retrieval verwendet werden. Als zentrale Eigenschaften und Prinzipien von GERTWOL können die folgenden aufgefaßt werden: GERTWOL - analysiert geschriebenes Hochdeutsch - gibt morphologische Daten zu deutschen Wortformen - leistet eine vollständige Flexionsmorphologie, eine umfassende Derivations- und Kompositionsmorphologie - gibt prinzipiell weder semantische noch syntaktische Daten - enthält den Grundwortschatz des Deutschen - bevorzugt traditionelle morphologische Kategorien Das Lexikon von GERTWOL besteht aus Teillexika, die miteinander verknüpft sind. In Teillexika werden in erster Linie Stammform- aber auch Vollformeinträge benutzt. Ein Stammformeintrag umfaßt die Stammform eines Wortes und ein Flexionsklassenkürzel, das als Pointer in eine Fortsetzungsklasse fungiert. In der Fortsetzungklasse werden zur Stammform durch Affixation Flexionsendungen und morphologische Daten angehängt. Das Zeichen "##" steht dafür, daß das Morphem am Ende der Wortform steht. Stammformeintrag: Stammform + Flexionsklassenkürzel; --> Fortsetzungsklasse Beispiel: *kind S4(s/es)/nt; LEXICON S4(s/es)/nt Sg1s/es/nt; Pl4/nt; LEXICON Sg1s/es/nt +S+NEUTR+SG+NOM: ##; --> Kind +S+NEUTR+SG+AKK: ##; --> Kind +S+NEUTR+SG+DAT: ##; --> Kind +S+NEUTR+SELTEN+SG+DAT:e ##; --> Kinde +S+NEUTR+SG+GEN:s ##; --> Kinds +S+NEUTR+SG+GEN:es ##; --> Kindes Ein Vollformeintrag enthält die Vollform des Wortes und die jeweiligen morphologischen Daten. Die sehr unregelmäßigen Wörter und die Wörter der nicht-flektierenden Wortarten werden als Vollformeinträge kodiert. Vollformeintrag: Wortform + morphologische Daten ##; Beispiel: sein+V+IMP+PRÄS+SG2:sei ##; --> sei da|durch+PRONADV:da|durch ##; --> dadurch GERTWOL gibt die Grundform einer Wortform, ihre Wortart und genauere morphologische Daten zum Numerus, Kasus, Genus, Modus und Tempus sowie zur Person und Komparation an. Die Basiswortarten in GERTWOL sind: A Adjektiv ABK Abkürzung ADV Adverb ART Artikel INTERJ Interjektion KONJ Konjunktion NUM Numerale PRÄP Präposition PRON Pronomen S Substantiv V Verb Der Wortform wird, falls nötig, ein zusätzliches Merkmal der Stilebene (+HÖFLICH, +GESPROCHEN, +VERALTET,+SELTEN) angefügt. Beispiele: Manne "*mann" S MASK SELTEN SG DAT "*mann" S MASK SELTEN SG DAT leset "lesen" V IMP PRÄS VERALTET PL2 "lesen" V IND PRÄS VERALTET PL2 ... geht's "gehen" V IND PRÄS GESPROCHEN SG3 es Sie "*sie" PRON PERS HÖFLICH SG/PL AKK "*sie" PRON PERS HÖFLICH SG/PL NOM ... 2.2. FLEXION 2.2.1. Flektierende Wortarten 2.2.1.1. Verben Die Kategorie wird als V notiert. Die Verben werden hinsichtlich des Modus, Tempus, der Person und des Numerus gekennzeichnet. Die Verben mit einem trennbaren Präfix bekommen das Merkmal TRENNBAR. Die Präfixe werden mit PRÄF markiert. (MODUS - TEMPUS - PERSON - NUMERUS) 1. V Verb 2. TRENNBAR trennbar abkommen 3. IND Indikativ läuft KONJ Konjunktiv komme IMP Imperativ komm INF Infinitiv sehen PART Partizip laufend 4. PRÄS Präsens PRÄT Präteritum PERF Perfekt 5. SG1 1. Pers. Singular SG2 2. Pers. Singular SG3 3. Pers. Singular PL1 1. Pers. Plural PL2 2. Pers. Plural PL3 3. Pers. Plural 6. zu Verbform mit "zu" anzukommen es Verbform mit "es" geht's (PRÄF trennbares Präfix ein) Beispiele: geschwommen "schwimmen" V PART PERF ... schwömme "schwimmen" V KONJ PRÄT SG3 "schwimmen" V KONJ PRÄT SG1 schwämme "schwimmen" SELTEN V KONJ PRÄT SG3 "schwimmen" SELTEN V KONJ PRÄT SG1 vorbeischwammst "vorbei|schwimmen" V TRENNBAR IND PRÄT SG2 GERTWOL enthält zwölf Konjugationsklassen für schwache Verben (Flexionsklassenkürzel V01). Sie unterscheiden sich bezüglich des Auslauts des Stammes (-s-Laute), der Bildung des Partizip Perfekts mit oder ohne "ge-" und der Separiertheit bzw. Nicht-Separiertheit des Präfixes. Beispiele: Konj.klasse s-Laut PartII trennbar mit ge- VO1 - + - reden V01a + + - vermissen V01* - - - studieren V01a(sep) + + + an/passen Die starken Verben haben in GERTWOL zwölf Hauptkonjugationsklassen (Flexionsklassenkürzel U1 - U6). Bei der Identifizierung der Konjugationsklasse spielen 1. der Auslaut des Stammes (-s-Laute), 2. die Umlautung im IND PRÄS SG2 und SG3 (UI), 3. die Brechung im IND PRÄS SG 2 und SG3 und 4. die zweite Umlautung (UII) im KONJ PRÄT eine entscheidende Rolle bei der Identifizierung der Konjugationsklasse. Zusätzlich beachtet das Konjugationssystem 5. die Bildung des Partizip Perfekts mit oder ohne ge- und 6. der Trennbarkeit bzw. Nicht-Trennbarkeit des Präfixes. Beispiele: Konj.klasse s-Laut UI Br. UII PartII trennbar mit ge- U1 - - - - + - reiten U1s + - - - + - preisen U1 s - - - - - + + ein/reiten U1 i * - - - - - - bereiten U2 - - - + + - finden U2s + - - + + - fließen U3 - + - - + - laufen U3s + + - - + - blasen U4 - + - + + - laden U4s + + - + + - waschen U5 - - + - + - schwären U5s + - + - + - - U6 - - + + + - sehen U6s + - + + + - lesen Die schwachen Verben, deren Stamm auf -er, -el oder -erl ausgeht (er/V, el/V und erl/V) und die unregelmäßigen schwachen Verben (z. B. brennen-brannte-gebrannt) bilden Sonderklassen. Die unregelmäßigen starken Verben "sein" und "werden" wurden gesondert als Vollformeinträge kodiert. Die Formenbildung fängt bei der Stammform an. Die schwachen Verben erhalten eine Stammform, die starken Verben sechs Stammformen, die sowohl vokalische als auch konsonantische Unterschiede aufweisen können. Beispiele: reden V01: V01 red laufen U3: U3 lauf läuf lauf lief lief lauf Einer Konjugationsklasse entspricht eine Kombination von Fortsetzungsklassen. In den Fortsetzungsklassen werden je die folgenden Verbformen gebildet: V1 INF IND PRÄS SG1, PL1, PL2, PL3 KONJ PRÄS SG1, SG2, SG3, PL1, PL2, PL3 IMP PRÄS PL2 PART PRÄS V2 IND PRÄS SG2, SG3 V3 IMP PRÄS SG2, SG3 V4 IND PRÄT SG1, SG2, SG3, PL1, PL2, PL3 V5 KONJ PRÄT SG1, SG2, SG3, PL1, PL2, PL3 V6 PART PERF Beispiele: V01 --> V1, V2, V3, V4R, V5R, V6R reden V01 U3 --> V1, V2b, V3, V4U, V5U, V6U laufen U3 GERTWOL analysiert Infinitiv- und Partizipformen (Partizip Präsens) mit "zu" und Verschmelzungen mit "es" sowie Varianten der Verbkonjugation, die entweder selten oder veraltet sind oder zur gesprochenen Sprache gehören. Beispiele: auszubildend "aus|bilden" V TRENNBAR PART PRÄS zu ... hat's "haben" V IND PRÄS GESPROCHEN SG3 es 2.2.1.2. Substantive Die Kategorie wird als S notiert. Als weitere Merkmale werden Genus, Numerus und Kasus angegeben. (GENUS - NUMERUS - KASUS) 1. S Substantiv 2. MASK Maskulinum Mann NEUTR Neutrum Mädchen FEM Femininum Frau 3. SG Singular PL Plural 4. NOM Nominativ AKK Akkusativ DAT Dativ GEN Genitiv Beispiele: Tisch "*tisch" S MASK SG DAT "*tisch" S MASK SG AKK "*tisch" S MASK SG NOM Tisches "*tisch" S MASK SG GEN Tischen "*tisch" S MASK PL DAT Die Substantive sind in GERTWOL in zehn Hauptdeklinationsklassen (Flexionsklassenkürzel S1 - S10) eingeteilt. Die Grobklassifizierung beruht auf 1. der Pluralbildung. 2. Auf Grund der möglichen Umlautung, 3. der jeweiligen Genitivendung, 4. der Möglichkeit der Restriktion des e-Zusatzes im SG DAT und 5. der Konsonantenverdoppelung entstehen insgesamt fast 300 substantivische Deklinationsklassen. Von den zehn Hauptklassen sind fünf den Neutra und den Maskulina gemeinsam, vier Deklinationsklassen sind ausschließlich der Feminina zugewiesen, eine Klasse nur den Maskulina. Die Umlautung der Substantive wird durch eine TWOL-Regel gesteuert (siehe 2.6.). Beispiele: Griff S1(s/es)/m; Kanal S1+(s)/m Phosphat S1(=s/es)/nt; Bus S1*(es)/m; Umlaut Genitiv Restriktion Konsonanten- "+" des e-Zusatzes verdoppelung "=" "*" S1(s/es) - s/es - - S1+(s) + s - - S1(=s/es) - s/es + - S1*(es) - es - + Jede substantivische Deklinationsklasse besteht aus einer Fortsetzungklasse mit Singularformen und einer Fortsetzungsklasse mit Pluralformen. Beispiel: LEXICON LEXICON LEXICON LEXICON Deklinations- S1(s/es) S1+(s) S1(=s/es) S1*(es) klasse Fortsetzungs- Sg1s/es; Sg1s; Sg1=s/es; Sg1*es; klassen Pl1; Pl1+; Pl1; Pl1*; Beispiel: Tag S1(s/es)/m; Sg1s/es; --> +S+MASK+SG+NOM: ##; +S+MASK+SG+AKK: ##; +S+MASK+SG+DAT: ##; +S+MASK+SELTEN+SG+DAT:e ##; +S+MASK+SG+GEN:s ##; +S+MASK+SG+GEN:es ##; Pl1; --> +S+MASK+PL+NOM:e ##; +S+MASK+PL+AKK:e ##; +S+MASK+PL+DAT:en ##; +S+MASK+PL+GEN:e ##; Die Singularia- und Pluraliatantum sowie Fremdwörter benutzen die jeweiligen singularischen oder pluralischen Fortsetzungsklassen. Beispiele: Spinat Sg1=s/es/m; Ferien Pl-; Signor Sg1=-/m; Signor Pli/m/end; Die Substantive mit einem produktiven Ableitungselement bilden 54 Fortsetzungsklassen. Zu diesen gehören z. B. S-ung, S-keit und S-tum, die wiederum die substantivischen Deklinationsklassen benutzen. Beispiel: LEXICON S-keit; --> S9en/f; 2.2.1.3. Adjektive Die Kategorie wird als A notiert. Weiter werden die Adjektive durch die Merkmale Kompariertheit, Numerus, Kasus und Genus charaktierisiert. (NUMERUS - KASUS - GENUS) 1. A Adjektiv A(PART) adjektiviertes Partizip 2. POS Positiv gut KOMP Komparativ besser SUP Superlativ beste SUP2 Superlativ 2 (am) besten INV indeklinabel beige 3. SG Singular PL Plural 4. NOM Nominativ AKK Akkusativ DAT Dativ GEN Genitiv 5. FEM Femininum MASK Maskulinum NEUTR Neutrum Beispiele: gut "gut" A POS besser "gut" A KOMP "wohl" ADV KOMP besten "wohl" ADV SUP "gut" A SUP2 "gut" A SUP SG AKK MASK ... unlesbares "un|les~bar" A POS SG AKK NEUTR "un|les~bar" A POS SG NOM NEUTR Die regelmäßigen Adjektive (Flexionsklassenkürzel A01) haben in GERTWOL siebzehn Deklinationsklassen, die sich bezüglich des e-Schwundes in Positiv- und Komparativformen und der Superlativendung unterscheiden. Beispiel: dunkel A01st-el; --> dunkler "dunkel" A POS SG NOM MASK ... --> dunklerer "dunkel" A KOMP SG NOM MASK ... --> dunkelster "dunkel" A SUP SG NOM MASK ... bunt A01est/st; --> bunteste "bunt" A SUP SG NOM MASK ... --> buntste "bunt" A SUP SELTEN SG NOM MASK ... Adjektivische Deklinationsklassen: A01e böse A01r elementar A01st schön A01st+ krank A01st-er finster A01st-er-dift teuer A01st-er-fremd makaber A01st-en eben A01st-en-part gefroren A01st-el dunkel A01est brüsk A01est+ kurz A01est/st bunt A01est/st-part leuchtend A01st/est frei A01-part-wohl wohlverdient AINV rosa Die Adjektive mit einem produktiven Ableitungselement bilden 26 Fortsetzungsklassen. Zu diesen gehören z. B. A-bar, A-isch und A-lich, die wiederum die adjektivischen Deklinationsklassen benutzen. Beispiel: LEXICON A-bar --> A01r Die adjektivierten Partizipien werden als eine Untergruppe der Adjektive aufgefaßt. Sie bekommen die Lesung +A(PART). Beispiel: gemachtes "ge|macht" A(PART) POS SG AKK NEUTR "ge|macht" A(PART) POS SG NOM NEUTR 2.2.1.4. Pronomina Die Kategorie wird als PRON notiert und durch Merkmale Numerus, Genus und Kasus charakterisiert. (NUMERUS - KASUS - GENUS) 1. PRON Pronomen 2. poss Possessivpronomen mein refl Reflexivpronomen dich rez reziprok einander 3. PERS Personalpronomen ich DEM Demonstrativpronomen dieser RELAT Relativpronomen denen INTERROG Interrogativpronomen wer INDEF Indefinitpronomen einige NEG negativ kein 4. (Det) determinativ kein 5. SG Singular PL Plural SG/PL Singular oder Plural SG1 1. Pers. Singular SG2 2. Pers. Singular SG3 3. Pers. Singular PL1 1. Pers. Plural PL2 2. Pers. Plural PL3 3. Pers. Plural 6. FEM Femininum MASK Maskulinum NEUTR Neutrum 7. NOM Nominativ AKK Akkusativ DAT Dativ GEN Genitiv 8. es es ich's Beispiele: ich "ich" PRON PERS SG1 NOM sich "er" refl PRON PERS SG3 AKK MASK ... Die meisten Pronomina werden nach Deklinationsklassen flektiert, die sehr unregelmäßigen Pronomina werden als Vollformeinträge kodiert. Die Possessiv- und Reflexivpronomina werden als eine Untergruppe der Personalpronomina erfaßt, um ihre Kongruenz mit dem Personalpronomen zu betonen. Beispiele: sich "sie" refl PRON PERS PL3 AKK ... mein "ich" poss PRON PERS (Det) SG NOM MASK ... Diejenigen Pronomina, die auch attributiv gebraucht werden können, bekommen eine +(Det)-Markierung. Beispiel: nichts "nichts" PRON INDEF (Det) NEG SG NOM ... 2.2.1.5. Artikel Die Kategorie wird als ART notiert. Die weiteren Merkmale sind Definiertheit, Numerus, Kasus und Genus. (NUMERUS - KASUS - GENUS) 1. ART Artikel 2. DEF bestimmt der INDEF unbestimmt ein 3. SG Singular PL Plural SG/PL Singular oder Plural 4. NOM Nominativ AKK Akkusativ DAT Dativ GEN Genitiv 5. FEM Femininum MASK Maskulinum NEUTR Neutrum Beispiele: einem "ein" ART INDEF SG DAT NEUTR "ein" ART INDEF SG DAT MASK... des "das" ART DEF SG GEN NEUTR "der" ART DEF SG GEN MASK... 2.2.1.6. Numeralien Die Kategorie wird als NUM notiert und hinsichtlich des Numerus, Kasus und Genus charakterisiert. GERTWOL enthält alle Kardinalia, Ordinalia und Bruchzahlen. Die Iterativa (z. B. siebenmal) und Multiplikativa (z. B. achtfach) werden zu Adverbien gezählt, die Kollektivzahlwörter (z. B. Dutzend) zu Substantiven. (NUMERUS - KASUS - GENUS) 1. NUM Numerale 2. KARD Kardinalzahl eins ORD Ordinalzahl zweiter BRUCH Bruchzahl viertel RÖM Römische Zahl III 3. SG Singular PL Plural SG/PL Singular oder Plural 4. NOM Nominativ AKK Akkusativ DAT Dativ GEN Genitiv 5. FEM Femininum MASK Maskulinum NEUTR Neutrum Beispiele: zwei "zwei" NUM KARD fünftausendvierhundertdreiundachtzig "fünf#tausend#vier#hundert#drei#und#achtzig" NUM KARD zwölftem "zwölft" NUM ORD SG DAT NEUTR "zwölft" NUM ORD SG DAT MASK Million "*million" S FEM SG NOM ... III "iii" * NUM KARD RÖM 34 "34" NUM KARD 2.2.1.7. Eigennamen Die Kategorie wird als S EIGEN notiert. Wenn möglich, werden auch die Merkmale Familienname und männlicher bzw. weiblicher Vorname angegeben. Die Eigennamen werden auch bezüglich des Genus, Numerus und Kasus markiert. (GENUS - NUMERUS - KASUS) 1. S Substantiv 2. EIGEN Eigenname 3. Vorname Vorname Famname Familinenname 3. MASK Maskulinum Herbert NEUTR Neutrum Finnland FEM Femininum Anna 4. SG Singular PL Plural 5. NOM Nominativ AKK Akkusativ DAT Dativ GEN Genitiv Die Gesamtzahlen der Eigennamen verteilen sich heute (Stand: Sept. 1994) wie folgt: Familiennamen 6 000 weibliche Vornamen 900 männliche Vornamen 1 400 geographische Namen 2 600 andere Eigennamen 850 Die männlichen Vornamen haben in GERTWOL vier, die weiblichen Vornamen acht und die Familiennamen vier Flexionsklassen. Die Identifizierung der Flexionsklasse geschieht auf Grund des Auslauts. Die Pluralformen aller Eigennamen sind mit +SELTEN markiert. Beispiele: Fritzens "*fritz" S EIGEN Vorname MASK SELTEN SG GEN Annen "*anne" S EIGEN Vorname FEM SELTEN PL NOM ... "*anna" S EIGEN Vorname FEM SELTEN PL NOM ... "*ann" S EIGEN Vorname FEM SELTEN PL NOM ... Goethe "*goethe" S EIGEN Famname SG NOM ... "*goethe" S EIGEN Famname SELTEN PL NOM ... Für Ortsnamen stellt GERTWOL 28 Flexionsklassen bereit. Von jedem Ortsnamen bildet GERTWOL die entsprechende Bezeichnung des Einwohners und der Einwohnerin und das entsprechende indeklinable Adjektiv. Dekl.klasse Ew. w. Ew. indekl.Adj Bremen ORT-en Bremer Bremerin Bremer Finnland ORT-land Finne Finnin Franken ORT-en/e+ Franke Fränkin GERTWOL enthält auch eine Auswahl von anderen Eigennamen (besonders Firmennamen). Ein Teil von diesen sind Abkürzungen, die die Lesung +ABK+S bekommen. Beispiele: Volkswagen "*volkswagen" S EIGEN MASK SG NOM ... BRD "*b*r*d" ABK S EIGEN FEM SG NOM ... Die allgemeinsten Bestandteile von Eigennamen bekommen die Lesung +EIGEN. Beispiele: de "de" EIGEN New "*new" EIGEN Airlines "*airlines" EIGEN 2.2.2. Nicht-flektierende Wortarten Die nicht-flektierenden Wortarten, nicht-substantivische Abkürzungen, Pronominaladverbien und Interjektionen werden nur als ABK, PRONADV oder INTERJ notiert. Außerdem bekommen die komparierten Formen von Adverbien (ADV), die Markierung KOMP oder SUP. ABK Abkürzung u.a. ADV Adverb dort PRONADV Pronominaladverb daran INTERJ Interjektion ah Beispiele: geb. "geb." ABK nächtens "nächt~ens" ADV dadurch "da|durch" PRONADV klingeling "klingeling" INTERJ GERTWOL geht davon aus, daß die meisten Adjektive im Satz als Adverbiale gebraucht werden können. Aus diesem Grunde bekommen prinzipiell keine Adjektive eine zusätzliche ADV-Lesung, sondern werden nur als A eingestuft. Dadurch bleibt die Anzahl der Adverbien in GERTWOL relativ gering. Die Präpositionen werden als PRÄP notiert und nach der Position im Präpositionalgefüge (vorgestellt oder nachgestellt) und der Rektion gekennzeichnet. 1. pre vorgestellt in post nachgestellt halber 2. PRÄP Präposition durch 3. Akk mit Akkusativ durch Dat mit Dativ mit Gen mit Genitiv trotz Beispiel: unter "unter" pre PRÄP Dat "unter" pre PRÄP Akk GERTWOL analysiert auch kontrahierte Formen (Präposition + Artikel). Beispiel: am "an-das" PRÄP ART DEF SG DAT NEUTR "an-der" PRÄP ART DEF SG DAT MASK 2.3. DERIVATION 2.3.1. Präfigierung 2.3.1.1. Präfigierung von Verben GERTWOL leistet ein System zur Präfigierung der Verben. Die folgenden Präfixe nehmen an der freien Präfigierung teil: 1. die untrennbaren be-, ent-, er-, ver-, zer-, 2. die trennbaren ab-, an-, auf-, aus-, bei-, ein-, mit-, nach-, vor-, zu- und 3. die sowohl trennbaren als auch untrennbaren durch-, hinter-, über-, um-, unter- und 4. ein Teil der Adverbien (u. a. hin-, her- sowie ihre Zusammensetzungen). Doppelpräfixe werden beschränkt produktiv gebildet. Beispiele: lächeln "läch~eln" V INF ... anlächle "an|läch~eln" V TRENNBAR KONJ PRÄS SG3 "an|läch~eln" V TRENNBAR KONJ PRÄS SG1 "an|läch~eln" V TRENNBAR IND PRÄS SG1 herausfinden "her|aus|finden" V TRENNBAR INF ... Auf Grund der Trennbarkeit bzw. Untrennbarkeit des Präfixes bildet GERTWOL das Partizip Perfekt mit oder ohne "ge" sowie die jeweilige Infinitivform mit "zu". Beispiele: Verb Präfix(e) Part.Perfekt & Infinitiv + zu an|kommen tr. angekommen, anzukommen be|stehen untr. bestanden, zu bestehen ab|be|rufen tr. + untr. abberufen, abzuberufen be|ab|sichtigen untr. + tr. beabsichtigt, zu beabsichtigen wieder|her|stellen tr. + tr. wiederhergestellt, wiederherzustellen 2.3.1.2. Präfigierung von Substantiven GERTWOL präfigiert Substantive. Beispiele: Un- + S Unabhängigkeit Mini- + S Minibus Unter- + S Unterschrift 2.3.1.3. Präfigierung von Adjektiven GERTWOL präfigiert auch Adjektive. Beispiele: ur- + A uralt multi- + A multinational 2.3.2. Suffigierung 2.3.2.1. Derivation ersten Grades Unter der Derivation ersten Grades wird hier das Anfügen eines Suffixes an ein freies Morphem verstanden. Es werden in GERTWOL von Verben Substantive auf -ung sowie von Substantiven Diminutiva auf -chen abgeleitet. Beispiele: V --> S-ung unter|drücken > Unter|drück~ung S --> S-chen Tür > Tür~chen 2.3.2.2. Syntagmatische Derivation Die syntagmatische Derivation bedeutet die Anfügung eines Suffixes an ein anderes Suffix. GERTWOL enthält etwa 80 Wortbildungsmuster dieses Typus. GERTWOL bildet z. B. von den Nomina agentis die entsprechenden movierten Feminina und von Adjektiven die entsprechenden Substantive. Beispiele: S-er --> S-in Lehr~er > Lehr~er~in A-bar --> S-keit brenn~bar > Brenn~bar~keit S-ist --> A-isch Athe~ist > athe~ist~isch A-al --> V-is~ier ide~al > ide~al~is~ieren S-e/m --> S-tum Griech~e > Griech~e\n~tum V-ier --> A-bar add~ieren > add~ier~bar GERTWOL bildet und analysiert auch abgeleitete Wörter, in denen das Suffix vor einem anderen Suffix morphophonologischen Änderungen unterliegt. Beispiele: A-ell --> V-isier institut~ion~ell > institut~ion~al~is~ieren ~ell > ~al~ A-ibel --> S-ität flex~ibel > Flex~ibil~ität ~ibel ~ibil~ 2.3.2.3. Paradigmatische Derivation Unter paradigmatischer Derivation wird hier die Anfügung von untereinander austauschbaren Suffixen an einen bestimmten Wortstamm verstanden. GERTWOL behandelt drei Derivationsprozesse dieser Art. Beispiele: finn S-e/m; > Finn~e S-in; > Finn~in A-isch; > finn~isch akust S-ik; > Akustik A-isch; > akustisch 2.3.3. Konversion Die Konversion bedeutet Derivation durch Übertritt eines Wortes in eine andere Wortart ohne morphologische Kennzeichnung. GERTWOL konvertiert Präsens- und Perfektpartizipien, Verbinfinitive und Adjektive zu Substantiven. V (Inf) --> S laufen > Laufen A --> S(A) besseres > Besseres A --> S(A) schönstes > Schönstes PART --> A(PART) gemacht > gemacht A(PART) --> S(PART) gewobenes > Gewobenes GERTWOL analysiert auch substantivische Zusammenrückungen. Beispiel: Haus-zu-Haus-Lieferung "*haus-zu-*haus-*liefer~ung" S FEM SG NOM ... 2.4. KOMPOSITION 2.4.1. Nomen-Nomen-Komposita GERTWOL leistet einen Mechanismus zur Kompositabildung für Nomen-Nomen-Komposita. Nur sehr kurze Wörter (zwei oder drei Buchstaben) sowie bestimmte andere Wörter, die wegen ihrer Lautstruktur sehr unwahrscheinliche Lesungen verursachen könnten (z. B. Schaft, Haft und Ende), nehmen nicht am Kompositionssystem teil. Komposita mit Wörtern dieser Art wurden gesondert in ein Teillexikon aufgenommen. Beispiele: Architektur Architekt#ur Abteile Abt#eile Augensprache Au#gen#sprache Kloster Klo#ster Gesichtsausdruck Gesicht#saus#druck Eigenschaft Ei#gen#schaft Automaten Au#tomaten Die Nahtstelle in Zusammensetzungen kann durch spezielle Fugenelemente gekennzeichnet werden (Kompositionsfuge). Das Kompositionssystem in GERTWOL geht davon aus, daß es im Deutschen weder generelle Fugenelemente aller Substantive noch spezifische Fugenelemente einzelner Substantive gibt, sondern Fugenelemente, die den Deklinationsklassen der Substantive spezifisch sind, d .i. sie gehören zum Flexionsparadigma des Erstgliedes. Maximal kann ein Substantiv als Erstglied eines Nomen-Nomen-Kompositums in drei Flexionsformen, d. s. SG NOM, SG GEN und PL NOM, vorkommen. Beispiel: Kind#frau SG NOM Kind\s#mörderin SG GEN Kind\es#entziehung SG GEN Kind\er#arzt PL NOM Einige Deklinationsklassen stellen nur ein Fugenelement bereit. Beispiel: Herr\en#mantel --> bei der Deklinationsklasse S6en/m; ist das Fugenelement immer -en Bei einigen Substantivsuffixen in bestimmten Deklinationsklassen ist nur eine Form des Erstgliedes möglich. Beispiel: Lehrling\s#not --> bei -ling S1(s)/m; ist das Fugenelement immer -s Die Feminina weisen bei bestimmten Suffixen ein -s-Fugenelement auf, das nicht zu ihrer Flexionsparadigma gehört. Diese sind die einzigen unparadigmatischen Fugenelemente. Beispiele: Wohnung\s#tür --> bei -ung S9en/f; ist das Fugenelement immer -s Sicherheit\s#glas --> bei -heit S9en/f; ist das Fugenelement immer -s Seltene und unregelmäßige Erstgliedformen wurden in ein Teillexikon aufgenommen. Beispiele: Weihnacht\s#baum Mond\en#schein Nachbar\s#kind GERTWOL erreicht eine bemerkenswerte Genauigkeit bei der Bestimmung der möglichen Fugenelemente, weil einerseits die Einteilung der Substantive in Deklinationsklassen sehr genau ist und andererseits die Substantivendungen, die nur ein mögliches Fugenelement aufweisen, zu Wörtern mit sehr hoher Frequenz gehören. So bekommen etwa 40 % der Substantive nur ein mögliches Fugenelement zugewiesen, etwa 40 % zwei und nur etwa 10 % drei mögliche Fugenelemente. GERTWOL analysiert auch mehrfache Komposita. Beispiele: Straße\n#bahn#linie Bund\es#verfassung\s#gericht 2.4.2. Andere Komposita 2.4.2.1. Substantivisches Zweitglied Neben den Substantiven können Eigennamen, Numeralien, Adjektive, adjektivierte Partizipien, Adverbien und Verbstämme als Erstglieder eines Kompositums mit nominalem Zweitglied (Substantiv o. substantiviertes Infinitiv) auftreten. EIGEN + S Goethe-Haus EIGEN + S Bachkantate NUM + S Vierkampf A + S Optimalsumme S(PART) + S Behindertenzentrum ADV + S Linksverkehr V + S Waschmaschine Diejenigen substantivischen Zweitglieder, die nicht als selbständige Wörter vorkommen, wurden in ein Teillexikon aufgenommen. Beispiele: Frei|beruf~ler Zweit|kläß~ler Kino|gäng~er Die bei den Wortgefügen mit einem gemeinsamen Zweitglied auftretende Erstglieder mit einem Ergänzungsbindestrich werden in GERTWOL als +ERSTGLIED kodiert. Beispiele: Ein- (in: Ein- und Ausgang) "*ein-" ERSTGLIED Personen- (in: Personen- und Lastkraftwagen) "*person\en-" ERSTGLIED 2.4.2.2. Adjektivisches Zweitglied In GERTWOL kann jedes Adjektiv mit einem anderen Adjektiv verbunden werden. Andere mögliche Erstglieder der Adjektive und der adjektivierten Partizipien sind Substantive, Adverbien, Verbstämme und Numeralien. A + A gelbgrün S + A erfolgssüchtig ADV + A linksextrem V + A fahrtüchtig NUM + A zweiblättrig In ein Teillexikon wurden Halbsuffixe (s. 2.5.2.) und nicht-selbständige adjektivische Zweitglieder aufgenommen. Beispiele: rache|durst~ig fett|arm gleich|altr~ig groß|bauch~ig Die Erstglieder mit einem Ergänzungsbindestrich bei adjektivischen Wortgefügen bekommen die Lesung +ERSTGLIED. Beispiel: hell- (in: hell- und dunkelblau) "hell-" ERSTGLIED 2.5. SEGMENTIERUNG DER WORTFORMEN 2.5.1. Allgemeines Bei der Segmentierung von Wortformen wurde danach bestrebt, das formal und semantisch identische, durch verschiedene Wortbildungselemente erweiterte Stamm-Morphem zu finden. Beispiele: lachen: läch\er~lich lach~haft läch\er~lich\er~weise Läch\er~lich~keit Lach~er Ge|lach~e Läch~eln läch~eln Nas~e rotz|näs~ig 2.5.2. Schwache vs. starke Kompositionsgrenze Durch eine starke Kompositionsgrenze (#) werden die Elemente getrennt, die auch als selbständige Wörter vorkommen können. Eine Ausnahme dazu sind die Verbstämme, die als Erstglieder vorkommen. Beispiele: Berg#wiese Schreib#maschine Durch eine schwache Kompositionsgrenze (|) werden Präpositionen, Präfixe und nicht-selbständige Elemente getrennt, die ausschließlich in Zusammensetzungen auftreten. Beispiele: Vor|schule geo|morpho|log~isch Auch vor einem nicht-selbständigen Zweitglied steht eine schwache Kompositionsgrenze. Beispiele: Mensch\en|recht~ler zwei|jähr~ig Unter einem Halbsuffix wird ein Wort verstanden, dessen Bedeutung als Kompositionsglied von der Bedeutung abweicht, die das Wort innehat, wenn es selbständig verwendet wird. Außerdem wird von einem Halbsuffix vorausgesetzt, daß es als Zweitglied in vielen Zusammensetzungen vorkommt, also reihenbildend ist. Die Halbsuffixe werden durch eine schwache Kompositionsgrenze getrennt. Beispiele: Laub|werk aber: Nach|schlag\e#werk Schul|wesen aber: Fabel#wesen fett|arm Die Segmentierung von drei- oder mehrteiligen Zusammensetzungen durch schwache und starke Kompositionsgrenzen kann in einigen Fällen zu semantisch merkwürdigen Elemente führen. Beispiel: Irren#haus|reif (vgl. Irr\en#haus aber nicht haus|reif) 2.5.3. Fugenelemente Die Fugenelemente treten entweder an der Kompositionsgrenze in Komposita mit einem verbalen oder einen substantivischen Erstglied oder vor einem Suffix auf. Sie werden mit einem Schrägstrich (\) getrennt. An der linken Seite des Fugenelementes bleibt in der Regel die Stammform des Wortes. Von einem Wort, das zwei Varianten hat, wird konsistent die kürzere Form als Stamm gewählt. Beispiele: Ein#famil~ie\n#haus Büch\er#bus Fried~e\ns#freund Vor einem Suffix wird immer das Fugenelement getrennt, das das Suffix voraussetzt und dessen Form entweder vom Suffix oder von der Deklinationsklasse des Wortes determiniert wird. Beispiele: glück~lich\er~weise Griech~e\n~tum 2.5.4. Suffixe 2.5.4.1. Substantivische Suffixe Heimische Suffixe: ~er Lehr~er ~ler Mensch\en|recht~ler ~ner Rent~ner ~ling Günst~ling ~e/f Eben~e ~e/m Griech~e ~sel Mit|bring~sel ~el/m Deck~el ~el/nt Acht~el ~el/f Form~el ~ei Blödel~ei ~erei Ras~erei ~nis Erlaub~nis ~ung Aus|üb~ung ~heit Dumm~heit ~schaft Mann~schaft ~tum König~tum ~igkeit An|spruch\s~los~igkeit ~keit Zwei|sprach~ig~keit ~icht Birk~icht ~sal Müh~sal ~tel/~stel Vier~tel ~chen Tür~chen ~in Lehr~er~in ~lein Heft~lein ~bold Witz~bold ~ian Dummr~ian Fremdsuffixe: ~an Kastell~an ~ant Fabrik~ant ~ent Dirig~ent ~ast Phant~ast ~ar Bibliothek~ar ~är Legion~är ~arier Prolet~arier ~ator Agit~ator ~and Diplom~and ~eur Mass~eur ~ist Kompon~ist ~ier bank~ier ~ade Promen~ade ~at Konsul~at ~ität Lokal~ität ~ur Kommandant~ur ~arium Ros~arium ~enz Resid~enz ~erie Drog~erie ~ee Gel~ee ~ament Fund~ament ~ment Invest~ment ~esse Delikat~esse ~age Karton~age ~alien Musik~alien ~atur Muskul~atur ~iar Mobil~iar ~iat Proletar~iat ~ik Motiv~ik ~aille Gener~aille ~al Person~al ~ing Train~ing ~ismus Patriot~ismus ~ion Diskret~ion ~ement Bombard~ement ~or Edit~or ~ör Fris~ör ~it Band~it ~ante Diskrimin~ante ~ente Tang~ente ~iade Spartak~iade ~asmus Enthusi~asmus ~ateur dekor~ateur ~ation inform~ation ~ie famil~ie ~ient abitur~ient ~iteur akquis~iteur ~ition invest~ition ~itor defin~itor ~anz domin~anz ~atik problem~atik ~atist kompar~atist ~ativum appell~ativum ~atum desider~atum ~elchen bäch~elchen ~elei wink~elei ~end substrah~end ~euse fris~euse ~iation denunz~iation ~iatur lin~iatur ~iker alkohol~iker ~ikum kosmet~ikum ~iment sort~iment ~itur invest~itur ~ivum reflex~ivum ~onik architekt~onik ~orium provis~orium ~ose a|vitamin~ose ~ariat prolet~ariat 2.5.4.2. Adjektivische Suffixe Heimische Suffixe: ~bar brauch~bar ~lich weib~lich ~haft fabel~haft ~ig berg~ig ~los an|spruch\s~los ~mäßig schül~er~mäßig ~isch melod~isch ~sam arbeit~sam ~en gold~en ~n kupfer~n ~ern eis~ern ~er zwanzig~er ~fach zwei~fach ~lei zwei\er~lei Fremdsuffixe: ~al funft~ion~al ~ell form~ell ~iv produkt~iv ~os lepr~os ~ar pol~ar ~är segment~är ~ant domin~ant ~ent differ~ent ~abel akzept~abel ~esk ballad~esk ~ial kolleg~ial ~iös graz~iös ~ös por~ös ~iell bakter~iell ~itiv defin~itiv ~uell grad~uell ~arisch statut~arisch ~atisch problem~atisch ~ativ affirm~ativ ~iär famil~iär ~itär autor~itär ~onisch architekt~onisch ~orisch provis~orisch ~ual prozent~ual ~uös inzest~uös 2.5.4.3. Adverbiale Suffixe ~dings neu\er~dings ~ens best~ens ~halben meinet~halben ~halber ordn~ung\s~halber ~lings füß~lings ~mals noch~mals ~maßen an|er|kannt\er~maßen ~s abend~s ~wärts berg~wärts ~weg schlecht~weg ~weise läch\er~lich\er~weise ~lich elendig~lich ~ends voll~ends ~falls gleich~falls ~halb unter~halb ~seits berg~seits ~wegen des~wegen 2.5.4.4. Verbale Suffixe ~ier buchstab~ier~en ~el läch~el~n ~is~ier signal~is~ier~en ~ifiz~ier person~ifiz~ier~en ~ig end~ig~en 2.6. DIE WICHTIGSTEN TWOL-REGELN GERTWOL enthält etwa 20 TWOL-Regeln. Die wichtigsten Zwei-Stufen-Regeln in GERTWOL steuern die folgenden Phänomene: -die e-Erweiterung im IND PRÄS SG2/3 und PL2, IMP PRÄS PL2, IND PRÄT und PART PERF bei schwachen Verben, deren Stamm entweder auf -d oder -t endet oder auf -m oder -n ausgeht, vor dem ein anderer Konsonent (kein -l oder -r) steht. Beispiele: reden --> redete (nicht: redte) atmen --> atmete (nicht: atmte) -die e-Tilgung im INF, IND PRÄS PL1/3, KONJ PRÄS SG2 und PL bei schwachen Verben, die auf -eln oder -ern ausgehen Beispiel: handeln (nich: handelen) -die e-Tilgung im INF, IND/KONJ PRÄS PL1/3, IND/KONJ PRÄT PL1/3 nach einem Vokal oder nach h in den auf -en ausgehenden Konjugationsendungen Beispiel: freuen/freun (jedoch: knien) -der n-Schwund im PL DAT bei auf -n ausgehenden Substantiven Beispiel: Laden --> Läden (nicht: Lädenn) -der Konsonantenschwund (s) bei Verben, die auf einen s-Laut ausgehen im IND PRÄS SG2 Beispiel: rasen --> rast (nicht: rasst) -der Konsonantenschwund (bei Verben mit Umlaut oder e/i-Wechsel) im IND PRÄS SG2/3 Beispiel: halten --> hält (nicht: hältt) -Umlautung bei Substantiven Beispiele: Mann, Männer Sohn, Söhne Buch, Bücher Baum, Bäume -die Rechtschreibung an der Nahtstelle in Komposita (drei Konsonanten) Beispiele: Schnitt + Tulpe --> Schnittulpe Sauerstoff + Flasche --> Sauerstoffflasche -die Rechtschreibung des ss/ß Beispiele: Kuß/Küsse vermissen/vermißt 3. SCHLUSSBEMERKUNGEN Die künftigen Vorhaben bezüglich GERTWOL: -Silbentrennung -lokale Disambiguation -Valenzangaben -Oberflächensyntax-Analyse -Satzglied-Lemmatisierung Literaturverzeichnis THE COLLINS GERMAN DICTIONARY Neubearbeitung Stuttgart 1991. Bußmann, Hadumod Lexikon der Sprachwissenschaft Stuttgart 1983. Duden Die Grammatik Mannheim 1984. Duden Deutsche Rechtschreibung Mannheim 1991. Duden Richtiges und gutes Deutsch Mannheim 1985. Flämig, Walter Grammatik des Deutschen Berlin 1991. Fleischer, Wolfgang, Irmhild Barz Wortbildung der deutschen Gegenwartssprache Tübingen 1992. Grube, Henner Die Fugenelemente in neuhochdeutschen Komposita In:Sprachwissenschaft 1 1976 187 - 222. Helbig, Gerhard; Joachim Buscha Deutsche Grammatik Ein Handbuch für den Ausländerunterricht Berlin 1991. Karlsson, Fred SWETWOL: A Comprehensive Morphological Analyser for Swedish. In: Nordic Journal of Linguistics, 15, 1-45. Koskenniemi, Kimmo TWO-LEVEL morphology: A General Computational Model for Word-Form Recognition and Production Helsinki 1983. Rackow, Ulrike Of the Treatment of Compounds in Machine Translation. A Study IWBS Report 1992. Rackow, Ulrike Ido Dagan, Ulrike Schwall COLING -92 Automatic Translation of Noun Compounds 1992. Wellmann, Hans, Nikolaus Reindl Annemarie Fahrmaier Zur morphologischen Regelung der Substantivkomposita im heutigen Deutsch In: Deutsche Philologie Band 93 Heft 3 1974. Wurzel, W.U., Studien zur deutschen Lautstruktur. Berlin 1970. GERTWOL-TAGSET SELTEN VERALTET GESPROCHEN HÖFLICH ABK Abkürzung geb. A Adjektiv ADV Adverb dort ART Artikel ein DEF bestimmt der INDEF unbestimmt ein INTERJ Interjektion ah iKONJ Infinitivkonjunktion zu nKONJ nebenordnende Konjunktion und sKONJ Satzteilkonjunktion als uKONJ unterordnende Konjunktion ob NUM Numerale KARD Kardinalzahl eins ORD Ordinalzahl zweiter BRUCH Bruchzahl viertel RÖM römische Zahl III A(PART) adjektiviertes Partizip gemachtes pre vorgestellt in post nachgestellt halber PRÄP Präposition durch Akk mit Akkusativ durch Dat mit Dativ mit Gen mit Genitiv trotz PRON Pronomen poss Possessivpronomen mein refl Reflexivpronomen dich rez reziprok einander PERS Personalpronomen ich DEM Demonstrativpronomen dieser RELAT Relativpronomen denen INTERROG Interrogativpronomen wer INDEF Indefinitpronomen einige NEG negativ kein (Det) determinativ kein PRONADV Pronominaladverb daran S Substantiv Kind S(A) Substantiviertes Adjektiv Gutes S(PART) Substantiviertes Partizip Gemachtes V Verb TRENNBAR trennbar abkommen IND Indikativ läuft KONJ Konjunktiv komme IMP Imperativ komm INF Infinitiv sehen PART Partizip laufend PRÄS Präsens PRÄT Präteritum PERF Perfekt SG1 1. Pers. Singular SG2 2. Pers. Singular SG3 3. Pers. Singular PL1 1. Pers. Plural PL2 2. Pers. Plural PL3 3. Pers. Plural zu Verbform mit "zu" anzukommen es Verbform mit "es" geht's PRÄF trennbares Präfix ein EIGEN Eigenname Famname Familienname Goethe Vorname Vorname Johann POS Positiv gut KOMP Komparativ besser SUP Superlativ beste SUP2 Superlativ 2 (am) besten INV indeklinabel beige SG Singular PL Plural SG/PL Singular oder Plural NOM Nominativ AKK Akkusativ DAT Dativ GEN Genitiv FEM Femininum MASK Maskulinum NEUTR Neutrum ERSTGLIED Erstglied # Starke Kompositionsgrenze Wört\er#buch | Schwache Kompositionsgrenze zwei|händ~ig \ Fugenelement ~ Suffix KOMMA PUNKT DOPPELPUNKT KLAMMER PROZENTZEICHEN FRAGEZEICHEN SEMIKOLON SCHRÄGSTRICH AUSRUFEZEICHEN BINDESTRICH ANFÜHRUNGSZEICHEN GEDANKENSTRICH PARAGRAPHZEICHEN STERN-ZEICHEN PLUS-ZEICHEN MINUS-ZEICHEN GLEICHHEITSZEICHEN NUMMERNZEICHEN ET-ZEICHEN AUSLASSUNGSPUNKTE