Hinweis: Originalversion des Berichts! Lediglich Hyperlinks und einige wenige Formatierungen wurden hinzugefügt. Zu Gertwol gibt es auch eine Online-Demoversion. Dieser Bericht bildet die Grundlage der 4. Vorlesung `Lexikonaufbau und Morphologieanalyse' an der Universität Zürich im Sommersemester 1999. (Dozent: Martin Volk)

GERTWOL: EIN SYSTEM ZUR AUTOMATISCHEN WORTFORMERKENNUNG DEUTSCHER WÖRTER

                                               Mariikka Haapalainen
                                                    Ari Majorin
                                                   Lingsoft, Inc.

                                                   September 1994


1. EINLEITUNG.........................................................

2. GERTWOL.............................................................
        
        2.1. ALLGEMEINES...............................................

        2.2. FLEXION...................................................

                2.2.1. Flektierende Wortarten
                        2.2.1.1. Verben
                        2.2.1.2. Substantive
                        2.2.1.3. Adjektive
                        2.2.1.4. Pronomina
                        2.2.1.5. Artikel
                        2.2.1.6. Numeralien
                        2.2.1.7. Eigennamen

                2.2.2. Nicht-flektierende Wortarten

        2.3. DERIVATION...............................................

                2.3.1. Präfigierung
                        2.3.1.1. Präfigierung von Verben
                        2.3.1.2. Präfigierung von Substantiven
                        2.3.1.3. Präfigierung von Adjektiven
                2.3.2. Suffigierung
                        2.3.2.1. Derivation ersten Grades
                        2.3.2.2. Syntagmatische Derivation
                        2.3.2.3. Paradigmatische Derivation
                2.3.3. Konversion

        2.4. KOMPOSITION..............................................

                2.4.1. Nomen-Nomen-Komposita
                2.4.2. Andere Komposita
                        2.4.2.1. Substantivisches Zweitglied
                        2.4.2.2. Adjektivisches Zweitglied

        2.5. SEGMENTIERUNG VON WORTFORMEN.............................

                2.5.1. Allgemeines
                2.5.2. Schwache vs. starke Kompositionsgrenze
                2.5.3. Fugenelemente
                2.5.4. Suffixe
                        2.5.4.1. Substantivische Suffixe
                        2.5.4.2. Adjektivische Suffixe
                        2.5.4.3. Adverbiale Suffixe
                        2.5.4.4. Verbale Suffixe

        2.6. DIE WICHTIGSTEN TWOL-REGELN..............................

3. SCHLUSSBEMERKUNGEN.................................................

LITERATURVERZEICHNIS...................................................

GERTWOL-TAGSET.........................................................




1. EINLEITUNG


GERTWOL ist ein System zur automatischen Wortformerkennung deutscher
Wörter. Die theoretische Grundlage des GERTWOL-Programms ist die
sprachunabhängige morphologische Analysemethode "Zwei-Ebenen-Modell"
von Prof. Dr. Kimmo Koskenniemi (TWOL, Two-Level-Morphologie, two-level
model 1983).

Die Zwei-Ebenen-Morphologie (TWOL) behandelt morphologische Phänomene
auf zwei Ebenen; auf der lexikalischen Ebene und auf der
Oberflächenebene. Einem Zeichen auf der lexikalischen Ebene entspricht
ein Zeichen -- möglicherweise ein Nullzeichen -- auf der
Oberflächenebene. Dies ermöglicht mit der gleichen Effizienz sowohl
die Analyse als auch die Generierung von Wortformen.

Die Hauptmittel von TWOL sind Fortsetzungsklassen und TWOL-Regeln. In
den Fortsetzungsklassen bekommen die Wörter Flexionsendungen. Die
TWOL-Regeln stellen ein bestimmtes Kontext fest, in dem einem Zeichen
der lexikalischen Ebene ein Zeichen der Oberflächenebene entsprechen
kann oder muß.

Das Alphabet von TWOL besteht neben den Buchstaben und Sonderzeichen
auch von diakritischen Zeichen, die die Funktion von TWOL-Regeln
steuern.

Bis heute ist das TWOL-System für etwa 30 Sprachen verwendet worden.



2. GERTWOL

2.1. ALLGEMEINES


Das Grundlexikon von GERTWOL ist das komplette Sprachmaterial des
Deutsch-Englischen Wörterbuchs von Collins (THE COLLINS GERMAN
DICTIONARY, Neubearbeitung 1991, Copyright HarperCollins
Publishers). Das Wortmaterial des CGD-Lexikons wurde aber deutlich
vervollständigt, als GERTWOL Tests an unterschiedlichen Korpora
unterzogen wurde. Es wurden z. B. über 6300 Substantive und ca. 11 000
Eigennamen hinzugefügt.

Die etwaigen Gesamtzahlen der Lexeme verteilen sich heute (Stand:
Sept. 1994) bei einzelnen Wortarten folgendermaßen:

        11 000 Adjektive
         2 000 Adverbien
           400 Interjektionen
        50 000 Substantive
         6 500 Verben
        12 000 Eigennamen
         1 700 Abkürzungen


Wenn auch die geschlossenen Wortarten Konjunktionen, Pronomina,
Artikel und Präpositionen mitgerechnet werden, verfügt GERTWOL über
ein Wortformenlexikon von etwa 85 000 Wortformen, deren
Geltungsbereich durch eine umfassende Derivationsmorphologie und einen
vollständigen Mechanismus zur Kompositabildung erheblich erweitert wird.


GERTWOL gibt die möglichen Lesungen einer deutschen Wortform an. Die
Lesungen bestehen aus der Grundform des Wortes und aus morphologischen
Daten zur Wortform.


Wortform

        Lesung: "Grundform" + morphologische Analyse
        Lesung: "Grundform" + morphologische Analyse
                                        etc.


Beispielsatz:

        -GERTWOL
                "*g*e*r*t*w*o*l"  ABK S EIGEN

        -ist
                "sein"  V IND PRÄS SG3
        
        -ein
                "ein"  PRÄF
                "ein"  ADV
                "ein"  NUM KARD
                "einen"  V IMP PRÄS GESPROCHEN SG2
                "ein"  ART INDEF SG AKK NEUTR
                "ein"  ART INDEF SG NOM NEUTR
                "ein"  ART INDEF SG NOM MASK

        -System
                 "*system"  S NEUTR SG DAT
                 "*system"  S NEUTR SG AKK
                 "*system"  S NEUTR SG NOM

        -zur
                "zu-die"  PRÄP ART DEF SG DAT FEM

        -automatischen
                "automat~isch"  A POS PL GEN
                "automat~isch"  A POS PL AKK
                "automat~isch"  A POS PL NOM
                "automat~isch"  A POS SG GEN FEM
                "automat~isch"  A POS SG DAT FEM
                "automat~isch"  A POS SG DAT NEUTR
                "automat~isch"  A POS SG DAT MASK
                "automat~isch"  A POS PL DAT
                "automat~isch"  A POS SG GEN NEUTR
                "automat~isch"  A POS SG GEN MASK
                "automat~isch"  A POS SG AKK MASK

        -Wortformerkennung
                "*wort#form~er#kenn~ung"  S FEM SG GEN
                "*wort#form~er#kenn~ung"  S FEM SG DAT
                "*wort#form~er#kenn~ung"  S FEM SG AKK
                "*wort#form~er#kenn~ung"  S FEM SG NOM
                "*wort#form#er|kenn~ung"  S FEM SG GEN
                "*wort#form#er|kenn~ung"  S FEM SG DAT
                "*wort#form#er|kenn~ung"  S FEM SG AKK
                "*wort#form#er|kenn~ung"  S FEM SG NOM

        -deutscher
                "deutsch"  A KOMP
                "deutsch"  A POS PL GEN
                "deutsch"  A POS SG GEN FEM
                "deutsch"  A POS SG DAT FEM
                "deutsch"  A POS SG NOM MASK

        -Wörter
                "*wort"  S NEUTR PL GEN
                "*wort"  S NEUTR PL AKK
                "*wort"  S NEUTR PL NOM

        .
                PUNKT


Eine Version von GERTWOL generiert Wortformen. Es wird dabei die
Grundform mit den erwünschten morphologischen Daten eingegeben. Auf
Grund dieser Angaben generiert GERTWOL die den Angaben entsprechende
Wortform.

Beispiele:

        lernen+v+ind+präs+sg3   -->     lernt

        gut+a+komp+sg+akk+neutr -->     besseres

        *buch+s+neutr+pl+dat    -->     *büchern


GERTWOL ist an unterschiedlichen Korpora, u.a. an Zeitungstexten,
Gesetzestexten, Wetterberichten, literarischen Texten und
Geschäftsberichten getestet worden und erreicht heute (Stand:
Sept. 1994) eine Datenabdeckung von über 99 % bei ortographisch
einwandfreien Texten und über 98 % bei unbeschränkten Texten. Die
Erkennungsraten von GERTWOL sind in SUN SPARCstation 2 etwa 200
Wortformen/Sekunde als morphologischer Analysator und etwa 700 W/S bei
Wortformerkennung ohne morphologische Analyse.

GERTWOL kann z. B. in Textanalyse, Ortographie-Korrektur und
Information-Retrieval verwendet werden.

Als zentrale Eigenschaften und Prinzipien von GERTWOL können die
folgenden aufgefaßt werden:

GERTWOL

        - analysiert geschriebenes Hochdeutsch

        - gibt morphologische Daten zu deutschen Wortformen

        - leistet eine vollständige Flexionsmorphologie, eine
          umfassende Derivations- und Kompositionsmorphologie

        - gibt prinzipiell weder semantische noch syntaktische Daten

        - enthält den Grundwortschatz des Deutschen

        - bevorzugt traditionelle morphologische Kategorien


Das Lexikon von GERTWOL besteht aus Teillexika, die miteinander
verknüpft sind. In Teillexika werden in erster Linie Stammform- aber
auch Vollformeinträge benutzt.

Ein Stammformeintrag umfaßt die Stammform eines Wortes und ein
Flexionsklassenkürzel, das als Pointer in eine Fortsetzungsklasse
fungiert. In der Fortsetzungklasse werden zur Stammform durch
Affixation Flexionsendungen und morphologische Daten angehängt. Das
Zeichen "##" steht dafür, daß das Morphem am Ende der Wortform steht.


        Stammformeintrag:

        Stammform + Flexionsklassenkürzel; --> Fortsetzungsklasse
        
        
Beispiel:

        *kind S4(s/es)/nt;

        LEXICON S4(s/es)/nt
        Sg1s/es/nt;
        Pl4/nt;
        
        LEXICON Sg1s/es/nt
        +S+NEUTR+SG+NOM: ##;            --> Kind
        +S+NEUTR+SG+AKK: ##;            --> Kind
        +S+NEUTR+SG+DAT: ##;            --> Kind
        +S+NEUTR+SELTEN+SG+DAT:e ##;    --> Kinde
        +S+NEUTR+SG+GEN:s ##;           --> Kinds
        +S+NEUTR+SG+GEN:es ##;          --> Kindes



Ein Vollformeintrag enthält die Vollform des Wortes und die jeweiligen
morphologischen Daten. Die sehr unregelmäßigen Wörter und die Wörter
der nicht-flektierenden Wortarten werden als Vollformeinträge kodiert.


        Vollformeintrag:

        Wortform + morphologische Daten ##;


Beispiel:

        sein+V+IMP+PRÄS+SG2:sei ##;     --> sei

        da|durch+PRONADV:da|durch ##;   --> dadurch


GERTWOL gibt die Grundform einer Wortform, ihre Wortart und genauere
morphologische Daten zum Numerus, Kasus, Genus, Modus und Tempus sowie
zur Person und Komparation an.

Die Basiswortarten in GERTWOL sind:

        A               Adjektiv
        ABK             Abkürzung
        ADV             Adverb
        ART             Artikel
        INTERJ          Interjektion
        KONJ            Konjunktion
        NUM             Numerale
        PRÄP            Präposition
        PRON            Pronomen
        S               Substantiv
        V               Verb


Der Wortform wird, falls nötig, ein zusätzliches Merkmal der Stilebene
(+HÖFLICH, +GESPROCHEN, +VERALTET,+SELTEN) angefügt.

Beispiele:

        Manne
                "*mann" S MASK SELTEN SG DAT
                "*mann" S MASK SELTEN SG DAT
        leset
                "lesen" V IMP PRÄS VERALTET PL2
                "lesen" V IND PRÄS VERALTET PL2
                 ...
        geht's
                "gehen" V IND PRÄS GESPROCHEN SG3 es
        Sie
                "*sie" PRON PERS HÖFLICH SG/PL AKK
                "*sie" PRON PERS HÖFLICH SG/PL NOM
                 ...



2.2. FLEXION


2.2.1. Flektierende Wortarten

2.2.1.1. Verben

Die Kategorie wird als V notiert. Die Verben werden hinsichtlich des
Modus, Tempus, der Person und des Numerus gekennzeichnet. Die Verben
mit einem trennbaren Präfix bekommen das Merkmal TRENNBAR. Die Präfixe
werden mit PRÄF markiert.


(MODUS - TEMPUS - PERSON - NUMERUS)


1. V            Verb

2. TRENNBAR     trennbar                abkommen

3. IND          Indikativ               läuft
   KONJ         Konjunktiv              komme
   IMP          Imperativ               komm

   INF          Infinitiv               sehen
   PART         Partizip                laufend

4. PRÄS         Präsens
   PRÄT         Präteritum

   PERF         Perfekt

5. SG1          1. Pers. Singular
   SG2          2. Pers. Singular
   SG3          3. Pers. Singular

   PL1          1. Pers. Plural
   PL2          2. Pers. Plural
   PL3          3. Pers. Plural


6. zu           Verbform mit "zu"       anzukommen
   es           Verbform mit "es"       geht's

  (PRÄF         trennbares Präfix       ein)


Beispiele:

        geschwommen
                 "schwimmen" V PART PERF
                  ...

        schwömme
                "schwimmen" V KONJ PRÄT SG3
                "schwimmen" V KONJ PRÄT SG1
        
        schwämme
                "schwimmen" SELTEN V KONJ PRÄT SG3
                "schwimmen" SELTEN V KONJ PRÄT SG1

        vorbeischwammst
                "vorbei|schwimmen" V TRENNBAR IND PRÄT SG2


GERTWOL enthält zwölf Konjugationsklassen für schwache Verben
(Flexionsklassenkürzel V01). Sie unterscheiden sich bezüglich des
Auslauts des Stammes (-s-Laute), der Bildung des Partizip Perfekts mit
oder ohne "ge-" und der Separiertheit bzw. Nicht-Separiertheit des
Präfixes.

Beispiele:

        Konj.klasse     s-Laut   PartII     trennbar
                                 mit ge-

        VO1               -         +          -         reden
        V01a              +         +          -         vermissen
        V01*              -         -          -         studieren
        V01a(sep)         +         +          +         an/passen
        

Die starken Verben haben in GERTWOL zwölf Hauptkonjugationsklassen
(Flexionsklassenkürzel U1 - U6). Bei der Identifizierung der
Konjugationsklasse spielen 
1. der Auslaut des Stammes (-s-Laute), 
2. die Umlautung im IND PRÄS SG2 und SG3 (UI), 
3. die Brechung im IND PRÄS SG 2 und SG3 und 
4. die zweite Umlautung (UII) im KONJ PRÄT 
eine entscheidende Rolle bei der Identifizierung der Konjugationsklasse.  
Zusätzlich beachtet das Konjugationssystem 
5. die Bildung des Partizip Perfekts mit oder ohne ge- und 
6. der Trennbarkeit bzw. Nicht-Trennbarkeit des Präfixes.

Beispiele:

        Konj.klasse  s-Laut   UI  Br.  UII  PartII  trennbar
                                            mit ge-

        U1           -        -   -     -     +       -        reiten
        U1s          +        -   -     -     +       -        preisen
        U1 s -       -        -   -     -     +       +        ein/reiten
        U1 i *       -        -   -     -     -       -        bereiten

        U2           -        -   -     +     +       -        finden
        U2s          +        -   -     +     +       -        fließen

        U3           -        +   -     -     +       -        laufen
        U3s          +        +   -     -     +       -        blasen


        U4           -        +   -     +     +       -        laden
        U4s          +        +   -     +     +       -        waschen

        U5           -        -   +     -     +       -        schwären
        U5s          +        -   +     -     +       -        -

        U6           -        -   +     +     +       -        sehen
        U6s          +        -   +     +     +       -        lesen


Die schwachen Verben, deren Stamm auf -er, -el oder -erl ausgeht
(er/V, el/V und erl/V) und die unregelmäßigen schwachen Verben
(z. B. brennen-brannte-gebrannt) bilden Sonderklassen.

Die unregelmäßigen starken Verben "sein" und "werden" wurden gesondert
als Vollformeinträge kodiert.

Die Formenbildung fängt bei der Stammform an. Die schwachen Verben
erhalten eine Stammform, die starken Verben sechs Stammformen, die
sowohl vokalische als auch konsonantische Unterschiede aufweisen
können.

Beispiele:

        reden V01: V01 red

        laufen U3: U3  lauf läuf lauf lief lief lauf


Einer Konjugationsklasse entspricht eine Kombination von
Fortsetzungsklassen. In den Fortsetzungsklassen werden je die
folgenden Verbformen gebildet:


        V1              INF
                        IND PRÄS SG1, PL1, PL2, PL3
                        KONJ PRÄS SG1, SG2, SG3, PL1, PL2, PL3
                        IMP PRÄS PL2
                        PART PRÄS

        V2              IND PRÄS SG2, SG3
        
        V3              IMP PRÄS SG2, SG3

        V4              IND PRÄT SG1, SG2, SG3, PL1, PL2, PL3

        V5              KONJ PRÄT SG1, SG2, SG3, PL1, PL2, PL3
        
        V6              PART PERF


Beispiele:

        V01 --> V1, V2, V3, V4R, V5R, V6R   reden V01

        U3 --> V1, V2b, V3, V4U, V5U, V6U   laufen U3


GERTWOL analysiert Infinitiv- und Partizipformen (Partizip Präsens)
mit "zu" und Verschmelzungen mit "es" sowie Varianten der
Verbkonjugation, die entweder selten oder veraltet sind oder zur
gesprochenen Sprache gehören.

Beispiele:

        auszubildend
                "aus|bilden"  V TRENNBAR PART PRÄS zu
                 ...

        hat's
                "haben"  V IND PRÄS GESPROCHEN SG3 es



2.2.1.2. Substantive


Die Kategorie wird als S notiert. Als weitere Merkmale werden Genus,
Numerus und Kasus angegeben.


(GENUS - NUMERUS - KASUS)


1. S            Substantiv

2. MASK         Maskulinum                      Mann
   NEUTR        Neutrum                         Mädchen
   FEM          Femininum                       Frau

3. SG           Singular
   PL           Plural

4. NOM          Nominativ
   AKK          Akkusativ
   DAT          Dativ
   GEN          Genitiv


Beispiele:

        Tisch
                "*tisch"  S MASK SG DAT
                "*tisch"  S MASK SG AKK
                "*tisch"  S MASK SG NOM

        Tisches
                "*tisch"  S MASK SG GEN
        
        Tischen
                "*tisch"  S MASK PL DAT


Die Substantive sind in GERTWOL in zehn Hauptdeklinationsklassen
(Flexionsklassenkürzel S1 - S10) eingeteilt. Die Grobklassifizierung
beruht auf 
1. der Pluralbildung. 
2. Auf Grund der möglichen Umlautung, 
3. der jeweiligen Genitivendung, 
4. der Möglichkeit der Restriktion des e-Zusatzes im SG DAT und 
5. der Konsonantenverdoppelung 
entstehen
insgesamt fast 300 substantivische Deklinationsklassen. Von den zehn
Hauptklassen sind fünf den Neutra und den Maskulina gemeinsam, vier
Deklinationsklassen sind ausschließlich der Feminina zugewiesen, eine
Klasse nur den Maskulina. Die Umlautung der Substantive wird durch
eine TWOL-Regel gesteuert (siehe 2.6.).

Beispiele:

        Griff S1(s/es)/m;
        Kanal S1+(s)/m
        Phosphat S1(=s/es)/nt;
        Bus S1*(es)/m;


                     Umlaut     Genitiv   Restriktion     Konsonanten-
                     "+"                  des e-Zusatzes  verdoppelung
                                              "="            "*"

        S1(s/es)      -           s/es         -              -

        S1+(s)        +            s           -              -

        S1(=s/es)     -           s/es         +              -

        S1*(es)       -            es          -              +


Jede substantivische Deklinationsklasse besteht aus einer
Fortsetzungklasse mit Singularformen und einer Fortsetzungsklasse mit
Pluralformen.

Beispiel:

                LEXICON         LEXICON     LEXICON       LEXICON
Deklinations-   S1(s/es)        S1+(s)      S1(=s/es)     S1*(es)
klasse

Fortsetzungs-   Sg1s/es;        Sg1s;       Sg1=s/es;     Sg1*es;
klassen         Pl1;            Pl1+;       Pl1;          Pl1*;


Beispiel:

        Tag S1(s/es)/m;
                Sg1s/es; --> +S+MASK+SG+NOM: ##;
                             +S+MASK+SG+AKK: ##;
                             +S+MASK+SG+DAT: ##;
                             +S+MASK+SELTEN+SG+DAT:e ##;
                             +S+MASK+SG+GEN:s ##;
                             +S+MASK+SG+GEN:es ##;
        
                Pl1; -->     +S+MASK+PL+NOM:e ##;
                             +S+MASK+PL+AKK:e ##;
                             +S+MASK+PL+DAT:en ##;
                             +S+MASK+PL+GEN:e ##;


Die Singularia- und Pluraliatantum sowie Fremdwörter benutzen die
jeweiligen singularischen oder pluralischen Fortsetzungsklassen.

Beispiele:
           Spinat Sg1=s/es/m;
           Ferien Pl-;

           Signor Sg1=-/m;
           Signor Pli/m/end;


Die Substantive mit einem produktiven Ableitungselement bilden 54
Fortsetzungsklassen. Zu diesen gehören z. B. S-ung, S-keit und S-tum,
die wiederum die substantivischen Deklinationsklassen benutzen.

Beispiel:

        LEXICON S-keit; --> S9en/f;



2.2.1.3. Adjektive

Die Kategorie wird als A notiert. Weiter werden die Adjektive durch
die Merkmale Kompariertheit, Numerus, Kasus und Genus
charaktierisiert.


(NUMERUS - KASUS - GENUS)


1. A            Adjektiv
   A(PART)      adjektiviertes Partizip
        
2. POS          Positiv                         gut
   KOMP         Komparativ                      besser
   SUP          Superlativ                      beste
   SUP2         Superlativ 2                    (am) besten

   INV          indeklinabel                    beige

3. SG           Singular
   PL           Plural

4. NOM          Nominativ
   AKK          Akkusativ
   DAT          Dativ
   GEN          Genitiv

5. FEM          Femininum
   MASK         Maskulinum
   NEUTR        Neutrum

------------ seit April 2001 ------------
6. UNDEKL
   SCHWACH
   STARK

Beispiele:

        gut
                "gut"  A POS

        besser
                "gut"  A KOMP
                "wohl"  ADV KOMP

        besten
                "wohl"  ADV SUP
                "gut"  A SUP2
                "gut"  A SUP SG AKK MASK
                 ...

        unlesbares
                "un|les~bar"  A POS SG AKK NEUTR
                "un|les~bar"  A POS SG NOM NEUTR


Die regelmäßigen Adjektive (Flexionsklassenkürzel A01) haben in GERTWOL
siebzehn Deklinationsklassen, die sich bezüglich des e-Schwundes in
Positiv- und Komparativformen und der Superlativendung unterscheiden.

Beispiel:

        dunkel A01st-el; --> dunkler
                                "dunkel"  A POS SG NOM MASK
                                 ...

                         --> dunklerer
                                "dunkel"  A KOMP SG NOM MASK
                                 ...

                         --> dunkelster
                                "dunkel"  A SUP SG NOM MASK
                                 ...


        bunt A01est/st;  --> bunteste
                                "bunt"  A SUP SG NOM MASK
                                 ...

                         --> buntste
                                "bunt"  A SUP SELTEN SG NOM MASK
                                 ...
        

Adjektivische Deklinationsklassen:

        A01e            böse
        A01r            elementar
        
        A01st           schön
        A01st+          krank
        A01st-er        finster
        A01st-er-dift   teuer
        A01st-er-fremd  makaber
        A01st-en        eben
        A01st-en-part   gefroren
        A01st-el        dunkel
        
        A01est          brüsk
        A01est+         kurz
        
        A01est/st       bunt
        A01est/st-part  leuchtend
        
        A01st/est       frei
        
        A01-part-wohl   wohlverdient

        AINV            rosa


Die Adjektive mit einem produktiven Ableitungselement bilden 26
Fortsetzungsklassen. Zu diesen gehören z. B. A-bar, A-isch und A-lich,
die wiederum die adjektivischen Deklinationsklassen benutzen.

Beispiel:

        LEXICON A-bar --> A01r

Die adjektivierten Partizipien werden als eine Untergruppe der
Adjektive aufgefaßt. Sie bekommen die Lesung +A(PART).

Beispiel:

        gemachtes
               "ge|macht"  A(PART) POS SG AKK NEUTR
               "ge|macht"  A(PART) POS SG NOM NEUTR



2.2.1.4. Pronomina

Die Kategorie wird als PRON notiert und durch Merkmale Numerus, Genus
und Kasus charakterisiert.


(NUMERUS - KASUS - GENUS)


1. PRON         Pronomen

2. poss         Possessivpronomen               mein
   refl         Reflexivpronomen                dich
   rez          reziprok                        einander

3. PERS         Personalpronomen                ich
   DEM          Demonstrativpronomen            dieser
   RELAT        Relativpronomen                 denen
   INTERROG     Interrogativpronomen            wer
   INDEF        Indefinitpronomen               einige
   NEG          negativ                         kein

4. (Det)        determinativ                    kein

5. SG           Singular
   PL           Plural
   SG/PL        Singular oder Plural

   SG1          1. Pers. Singular
   SG2          2. Pers. Singular
   SG3          3. Pers. Singular

   PL1          1. Pers. Plural
   PL2          2. Pers. Plural
   PL3          3. Pers. Plural

6. FEM          Femininum
   MASK         Maskulinum
   NEUTR        Neutrum

7. NOM          Nominativ
   AKK          Akkusativ
   DAT          Dativ
   GEN          Genitiv

8. es           es                              ich's


Beispiele:

        ich
                "ich"  PRON PERS SG1 NOM

        sich
                "er"  refl PRON PERS SG3 AKK MASK ...
                
        
Die meisten Pronomina werden nach Deklinationsklassen flektiert, die
sehr unregelmäßigen Pronomina werden als Vollformeinträge kodiert.

Die Possessiv- und Reflexivpronomina werden als eine Untergruppe der
Personalpronomina erfaßt, um ihre Kongruenz mit dem Personalpronomen
zu betonen.

Beispiele:
        
        sich
                "sie"  refl PRON PERS PL3 AKK
                 ...

        mein
                "ich"  poss PRON PERS (Det) SG NOM MASK
                 ...

Diejenigen Pronomina, die auch attributiv gebraucht werden können,
bekommen eine +(Det)-Markierung.

Beispiel:

        nichts
                "nichts"  PRON INDEF (Det) NEG SG NOM
                 ...



2.2.1.5. Artikel

Die Kategorie wird als ART notiert. Die weiteren Merkmale sind
Definiertheit, Numerus, Kasus und Genus.


(NUMERUS - KASUS - GENUS)


1. ART          Artikel

2. DEF          bestimmt                        der
   INDEF        unbestimmt                      ein

3. SG           Singular
   PL           Plural
   SG/PL        Singular oder Plural

4. NOM          Nominativ
   AKK          Akkusativ
   DAT          Dativ
   GEN          Genitiv

5. FEM          Femininum
   MASK         Maskulinum
   NEUTR        Neutrum


Beispiele:

        einem
                "ein"  ART INDEF SG DAT NEUTR
                "ein"  ART INDEF SG DAT MASK...

        des
                "das"  ART DEF SG GEN NEUTR
                "der"  ART DEF SG GEN MASK...



2.2.1.6. Numeralien

Die Kategorie wird als NUM notiert und hinsichtlich des Numerus, Kasus
und Genus charakterisiert.

GERTWOL enthält alle Kardinalia, Ordinalia und Bruchzahlen. Die Iterativa
(z. B. siebenmal) und Multiplikativa (z. B. achtfach) werden zu
Adverbien gezählt, die Kollektivzahlwörter (z. B. Dutzend) zu
Substantiven.


(NUMERUS - KASUS - GENUS)


1. NUM          Numerale

2. KARD         Kardinalzahl                    eins
   ORD          Ordinalzahl                     zweiter
   BRUCH        Bruchzahl                       viertel
   RÖM          Römische Zahl                   III

3. SG           Singular
   PL           Plural
   SG/PL        Singular oder Plural

4. NOM          Nominativ
   AKK          Akkusativ
   DAT          Dativ
   GEN          Genitiv

5. FEM          Femininum
   MASK         Maskulinum
   NEUTR        Neutrum


Beispiele:

        zwei
                "zwei"  NUM KARD

        fünftausendvierhundertdreiundachtzig
                "fünf#tausend#vier#hundert#drei#und#achtzig"  NUM KARD

        zwölftem
                "zwölft"  NUM ORD SG DAT NEUTR
                "zwölft"  NUM ORD SG DAT MASK

        Million
                 "*million"  S FEM SG NOM ...

        III
                 "iii"  * NUM KARD RÖM

        34
                 "34"  NUM KARD




2.2.1.7. Eigennamen

Die Kategorie wird als S EIGEN notiert. Wenn möglich, werden auch die
Merkmale Familienname und männlicher bzw. weiblicher Vorname
angegeben. Die Eigennamen werden auch bezüglich des Genus, Numerus und
Kasus markiert.


(GENUS - NUMERUS - KASUS)


1. S            Substantiv

2. EIGEN        Eigenname

3. Vorname      Vorname
   Famname      Familinenname

3. MASK         Maskulinum                      Herbert
   NEUTR        Neutrum                         Finnland
   FEM          Femininum                       Anna

4. SG           Singular
   PL           Plural

5. NOM          Nominativ
   AKK          Akkusativ
   DAT          Dativ
   GEN          Genitiv



Die Gesamtzahlen der Eigennamen verteilen sich heute (Stand:
Sept. 1994) wie folgt:


        Familiennamen           6 000
        weibliche Vornamen        900
        männliche Vornamen      1 400
        geographische Namen     2 600
        andere Eigennamen         850
        
Die männlichen Vornamen haben in GERTWOL vier, die weiblichen Vornamen
acht und die Familiennamen vier Flexionsklassen. Die Identifizierung
der Flexionsklasse geschieht auf Grund des Auslauts. Die Pluralformen
aller Eigennamen sind mit +SELTEN markiert.

Beispiele:

        Fritzens
                "*fritz"  S EIGEN Vorname MASK SELTEN SG GEN

        Annen
                "*anne"  S EIGEN Vorname FEM SELTEN PL NOM
                 ...
                "*anna"  S EIGEN Vorname FEM SELTEN PL NOM
                 ...
                "*ann"  S EIGEN Vorname FEM SELTEN PL NOM
                 ...

        Goethe
                "*goethe"  S EIGEN Famname SG NOM
                 ...
                "*goethe"  S EIGEN Famname SELTEN PL NOM
                 ...

Für Ortsnamen stellt GERTWOL 28 Flexionsklassen bereit. Von jedem
Ortsnamen bildet GERTWOL die entsprechende Bezeichnung des Einwohners
und der Einwohnerin und das entsprechende indeklinable Adjektiv.

        
                   Dekl.klasse  Ew.     w. Ew.     indekl.Adj

        Bremen     ORT-en       Bremer  Bremerin   Bremer
        Finnland   ORT-land     Finne   Finnin
        Franken    ORT-en/e+    Franke  Fränkin


GERTWOL enthält auch eine Auswahl von anderen Eigennamen (besonders
Firmennamen). Ein Teil von diesen sind Abkürzungen, die die Lesung
+ABK+S bekommen.

Beispiele:

        Volkswagen
                "*volkswagen"  S EIGEN MASK SG NOM ...

        BRD
                 "*b*r*d"  ABK S EIGEN FEM SG NOM ...


Die allgemeinsten Bestandteile von Eigennamen bekommen die Lesung +EIGEN.

Beispiele:

        de
                 "de"  EIGEN

        New
                 "*new"  EIGEN

        Airlines
                 "*airlines"  EIGEN



2.2.2. Nicht-flektierende Wortarten

Die nicht-flektierenden Wortarten, nicht-substantivische Abkürzungen,
Pronominaladverbien und Interjektionen werden nur als ABK, PRONADV
oder INTERJ notiert. Außerdem bekommen die komparierten Formen von
Adverbien (ADV), die Markierung KOMP oder SUP.


ABK            Abkürzung                       u.a.
ADV            Adverb                          dort
PRONADV        Pronominaladverb                daran
INTERJ         Interjektion                    ah

Beispiele:

        geb.
                 "geb."  ABK

        nächtens
                 "nächt~ens"  ADV

        dadurch
                 "da|durch"  PRONADV

        klingeling

                 "klingeling"  INTERJ



GERTWOL geht davon aus, daß die meisten Adjektive im Satz als
Adverbiale gebraucht werden können. Aus diesem Grunde bekommen
prinzipiell keine Adjektive eine zusätzliche ADV-Lesung, sondern
werden nur als A eingestuft. Dadurch bleibt die Anzahl der Adverbien
in GERTWOL relativ gering.

Die Präpositionen werden als PRÄP notiert und nach der Position im
Präpositionalgefüge (vorgestellt oder nachgestellt) und der Rektion
gekennzeichnet.


1.  pre vorgestellt 		in
    post nachgestellt 		halber

2.  PRÄP Präposition 		durch

3.  Akk mit Akkusativ 		durch
    Dat mit Dativ 		mit
    Gen mit Genitiv 		trotz

Beispiel:

        unter
                "unter" pre PRÄP Dat
                "unter" pre PRÄP Akk


GERTWOL analysiert auch kontrahierte Formen (Präposition + Artikel).

Beispiel:

        am
                "an-das" PRÄP ART DEF SG DAT NEUTR
                "an-der" PRÄP ART DEF SG DAT MASK



2.3. DERIVATION

2.3.1. Präfigierung

2.3.1.1. Präfigierung von Verben

GERTWOL leistet ein System zur Präfigierung der Verben. Die folgenden
Präfixe nehmen an der freien Präfigierung teil: 
1. die untrennbaren be-, ent-, er-, ver-, zer-, 
2. die trennbaren ab-, an-, auf-, aus-, bei-, ein-, mit-, nach-, vor-, zu- und 
3. die sowohl trennbaren als auch untrennbaren durch-, hinter-, über-, um-, 
   unter-  und 
4. ein Teil der Adverbien (u. a. hin-, her- sowie ihre Zusammensetzungen). 
Doppelpräfixe werden beschränkt produktiv gebildet.

Beispiele:

        lächeln
                "läch~eln" V INF
                 ...

        anlächle
                "an|läch~eln" V TRENNBAR KONJ PRÄS SG3
                "an|läch~eln" V TRENNBAR KONJ PRÄS SG1
                "an|läch~eln" V TRENNBAR IND PRÄS SG1


        herausfinden
                "her|aus|finden" V TRENNBAR INF
                 ...


Auf Grund der Trennbarkeit bzw. Untrennbarkeit des Präfixes bildet
GERTWOL das Partizip Perfekt mit oder ohne "ge" sowie die jeweilige
Infinitivform mit "zu".

Beispiele:

Verb Präfix(e) Part.Perfekt & Infinitiv + zu

an|kommen 	    tr. 	angekommen, anzukommen 
be|stehen 	    untr.  	bestanden, zu bestehen 
ab|be|rufen 	    tr. + untr. abberufen, abzuberufen
be|ab|sichtigen     untr. + tr.	beabsichtigt, zu beabsichtigen
wieder|her|stellen  tr. + tr.  	wiederhergestellt, wiederherzustellen



2.3.1.2. Präfigierung von Substantiven

GERTWOL präfigiert Substantive.

Beispiele:
        
        Un- + S Unabhängigkeit

        Mini- + S Minibus

        Unter- + S Unterschrift


2.3.1.3. Präfigierung von Adjektiven

GERTWOL präfigiert auch Adjektive.

Beispiele:
        
        ur- + A uralt

        multi- + A multinational



2.3.2. Suffigierung

2.3.2.1. Derivation ersten Grades

Unter der Derivation ersten Grades wird hier das Anfügen eines
Suffixes an ein freies Morphem verstanden. Es werden in GERTWOL von
Verben Substantive auf -ung sowie von Substantiven Diminutiva auf
-chen abgeleitet.

Beispiele:

        V --> S-ung unter|drücken > Unter|drück~ung

        S --> S-chen Tür > Tür~chen



2.3.2.2. Syntagmatische Derivation

Die syntagmatische Derivation bedeutet die Anfügung eines Suffixes an
ein anderes Suffix. GERTWOL enthält etwa 80 Wortbildungsmuster dieses
Typus. GERTWOL bildet z. B. von den Nomina agentis die entsprechenden
movierten Feminina und von Adjektiven die entsprechenden Substantive.

Beispiele:

        S-er --> S-in 		Lehr~er > Lehr~er~in
        
        A-bar --> S-keit 	brenn~bar > Brenn~bar~keit

        S-ist --> A-isch 	Athe~ist > athe~ist~isch

        A-al --> V-is~ier 	ide~al > ide~al~is~ieren
        
        S-e/m --> S-tum 	Griech~e > Griech~e\n~tum

        V-ier --> A-bar 	add~ieren > add~ier~bar


GERTWOL bildet und analysiert auch abgeleitete Wörter, in denen das
Suffix vor einem anderen Suffix morphophonologischen Änderungen
unterliegt.

Beispiele:

        A-ell --> V-isier institut~ion~ell > institut~ion~al~is~ieren
                                          ~ell > ~al~

        A-ibel --> S-ität flex~ibel > Flex~ibil~ität
                                  ~ibel ~ibil~




2.3.2.3. Paradigmatische Derivation

Unter paradigmatischer Derivation wird hier die Anfügung von
untereinander austauschbaren Suffixen an einen bestimmten Wortstamm
verstanden. GERTWOL behandelt drei Derivationsprozesse dieser Art.

Beispiele:

        finn S-e/m; > Finn~e
                S-in; > Finn~in
                A-isch; > finn~isch

        akust S-ik; > Akustik
                A-isch; > akustisch



2.3.3. Konversion

Die Konversion bedeutet Derivation durch Übertritt eines Wortes in
eine andere Wortart ohne morphologische Kennzeichnung.

GERTWOL konvertiert Präsens- und Perfektpartizipien, Verbinfinitive
und Adjektive zu Substantiven.


        V (Inf) --> S 		laufen > Laufen

        A --> S(A) 		besseres > Besseres

        A --> S(A) 		schönstes > Schönstes

        PART --> A(PART) 	gemacht > gemacht

        A(PART) --> S(PART) 	gewobenes > Gewobenes


GERTWOL analysiert auch substantivische Zusammenrückungen.

Beispiel:

        Haus-zu-Haus-Lieferung
                "*haus-zu-*haus-*liefer~ung" S FEM SG NOM
                 ...



2.4. KOMPOSITION


2.4.1. Nomen-Nomen-Komposita

GERTWOL leistet einen Mechanismus zur Kompositabildung für
Nomen-Nomen-Komposita.

Nur sehr kurze Wörter (zwei oder drei Buchstaben) sowie bestimmte
andere Wörter, die wegen ihrer Lautstruktur sehr unwahrscheinliche
Lesungen verursachen könnten (z. B. Schaft, Haft und Ende), nehmen
nicht am Kompositionssystem teil. Komposita mit Wörtern dieser Art
wurden gesondert in ein Teillexikon aufgenommen.

Beispiele:

        Architektur       Architekt#ur
        Abteile           Abt#eile
        Augensprache      Au#gen#sprache
        Kloster           Klo#ster
        Gesichtsausdruck  Gesicht#saus#druck
        Eigenschaft       Ei#gen#schaft
        Automaten         Au#tomaten


Die Nahtstelle in Zusammensetzungen kann durch spezielle Fugenelemente
gekennzeichnet werden (Kompositionsfuge). Das Kompositionssystem in
GERTWOL geht davon aus, daß es im Deutschen weder generelle
Fugenelemente aller Substantive noch spezifische Fugenelemente
einzelner Substantive gibt, sondern Fugenelemente, die den
Deklinationsklassen der Substantive spezifisch sind, d .i. sie gehören
zum Flexionsparadigma des Erstgliedes.

Maximal kann ein Substantiv als Erstglied eines Nomen-Nomen-Kompositums
in drei Flexionsformen, d. s. SG NOM, SG GEN und PL NOM, vorkommen.

Beispiel:

        Kind#frau               SG NOM
        Kind\s#mörderin         SG GEN
        Kind\es#entziehung      SG GEN
        Kind\er#arzt            PL NOM


Einige Deklinationsklassen stellen nur ein Fugenelement bereit.

Beispiel:

        Herr\en#mantel     -->  bei der Deklinationsklasse S6en/m;
                                ist das Fugenelement immer -en
                

Bei einigen Substantivsuffixen in bestimmten Deklinationsklassen ist
nur eine Form des Erstgliedes möglich.

Beispiel:

        Lehrling\s#not     -->  bei -ling S1(s)/m; ist das
                                Fugenelement immer -s


Die Feminina weisen bei bestimmten Suffixen ein -s-Fugenelement auf,
das nicht zu ihrer Flexionsparadigma gehört. Diese sind die
einzigen unparadigmatischen Fugenelemente.

Beispiele:

        Wohnung\s#tür      -->  bei -ung S9en/f; ist das
                                Fugenelement immer -s

        Sicherheit\s#glas  -->  bei -heit S9en/f; ist das
                                Fugenelement immer -s

Seltene und unregelmäßige Erstgliedformen wurden in ein Teillexikon
aufgenommen.

Beispiele:

        Weihnacht\s#baum
        Mond\en#schein
        Nachbar\s#kind


GERTWOL erreicht eine bemerkenswerte Genauigkeit bei der Bestimmung
der möglichen Fugenelemente, weil einerseits die Einteilung der
Substantive in Deklinationsklassen sehr genau ist und andererseits die
Substantivendungen, die nur ein mögliches Fugenelement aufweisen, zu
Wörtern mit sehr hoher Frequenz gehören. So bekommen etwa 40 % der
Substantive nur ein mögliches Fugenelement zugewiesen, etwa 40 % zwei
und nur etwa 10 % drei mögliche Fugenelemente.

GERTWOL analysiert auch mehrfache Komposita.

Beispiele:

        Straße\n#bahn#linie
        Bund\es#verfassung\s#gericht



2.4.2. Andere Komposita

2.4.2.1. Substantivisches Zweitglied

Neben den Substantiven können Eigennamen, Numeralien, Adjektive,
adjektivierte Partizipien, Adverbien und Verbstämme als Erstglieder
eines Kompositums mit nominalem Zweitglied (Substantiv
o. substantiviertes Infinitiv) auftreten.


        EIGEN           +       S       Goethe-Haus

        EIGEN           +       S       Bachkantate

        NUM             +       S       Vierkampf

        A               +       S       Optimalsumme

        S(PART)         +       S       Behindertenzentrum

        ADV             +       S       Linksverkehr

        V               +       S       Waschmaschine

        


Diejenigen substantivischen Zweitglieder, die nicht als selbständige
Wörter vorkommen, wurden in ein Teillexikon aufgenommen.

Beispiele:

        Frei|beruf~ler
        Zweit|kläß~ler
        Kino|gäng~er


Die bei den Wortgefügen mit einem gemeinsamen Zweitglied auftretende
Erstglieder mit einem Ergänzungsbindestrich werden in GERTWOL als
+ERSTGLIED kodiert.

Beispiele:

        Ein- (in: Ein- und Ausgang)
                "*ein-"  ERSTGLIED


        Personen- (in: Personen- und Lastkraftwagen)
                "*person\en-"  ERSTGLIED
        


2.4.2.2. Adjektivisches Zweitglied

In GERTWOL kann jedes Adjektiv mit einem anderen Adjektiv verbunden
werden. Andere mögliche Erstglieder der Adjektive und der
adjektivierten Partizipien sind Substantive, Adverbien, Verbstämme und
Numeralien.


        A               +       A       gelbgrün

        S               +       A       erfolgssüchtig

        ADV             +       A       linksextrem

        V               +       A       fahrtüchtig

        NUM             +       A       zweiblättrig


In ein Teillexikon wurden Halbsuffixe (s. 2.5.2.) und nicht-selbständige
adjektivische Zweitglieder aufgenommen.

Beispiele:
        
        rache|durst~ig
        fett|arm
        gleich|altr~ig
        groß|bauch~ig


Die Erstglieder mit einem Ergänzungsbindestrich bei adjektivischen
Wortgefügen bekommen die Lesung +ERSTGLIED.

Beispiel:
        
        hell- (in: hell- und dunkelblau)
                "hell-"  ERSTGLIED



2.5. SEGMENTIERUNG DER WORTFORMEN

2.5.1. Allgemeines

Bei der Segmentierung von Wortformen wurde danach bestrebt, das formal
und semantisch identische, durch verschiedene Wortbildungselemente
erweiterte Stamm-Morphem zu finden.

Beispiele:

        lachen:
        läch\er~lich
        lach~haft
        läch\er~lich\er~weise
        Läch\er~lich~keit
        Lach~er
        Ge|lach~e
        Läch~eln
        läch~eln

        Nas~e
        rotz|näs~ig


2.5.2. Schwache vs. starke Kompositionsgrenze

Durch eine starke Kompositionsgrenze (#) werden die Elemente
getrennt, die auch als selbständige Wörter vorkommen können. Eine
Ausnahme dazu sind die Verbstämme, die als Erstglieder vorkommen.

Beispiele:

        Berg#wiese
        Schreib#maschine


Durch eine schwache Kompositionsgrenze (|) werden Präpositionen,
Präfixe und nicht-selbständige Elemente getrennt, die ausschließlich
in Zusammensetzungen auftreten.

Beispiele:
        
        Vor|schule
        geo|morpho|log~isch


Auch vor einem nicht-selbständigen Zweitglied steht eine schwache
Kompositionsgrenze.

Beispiele:
        
        Mensch\en|recht~ler
        zwei|jähr~ig


Unter einem Halbsuffix wird ein Wort verstanden, dessen Bedeutung als
Kompositionsglied von der Bedeutung abweicht, die das Wort innehat,
wenn es selbständig verwendet wird. Außerdem wird von einem Halbsuffix
vorausgesetzt, daß es als Zweitglied in vielen Zusammensetzungen
vorkommt, also reihenbildend ist. Die Halbsuffixe werden durch eine
schwache Kompositionsgrenze getrennt.

Beispiele:
        
        Laub|werk 	aber: Nach|schlag\e#werk
        Schul|wesen 	aber: Fabel#wesen
        fett|arm


Die Segmentierung von drei- oder mehrteiligen Zusammensetzungen
durch schwache und starke Kompositionsgrenzen kann in einigen Fällen
zu semantisch merkwürdigen Elemente führen.

Beispiel: Irren#haus|reif (vgl. Irr\en#haus aber nicht haus|reif)



2.5.3. Fugenelemente

Die Fugenelemente treten entweder an der Kompositionsgrenze in
Komposita mit einem verbalen oder einen substantivischen Erstglied
oder vor einem Suffix auf. Sie werden mit einem Schrägstrich (\)
getrennt. An der linken Seite des Fugenelementes bleibt in der Regel
die Stammform des Wortes. Von einem Wort, das zwei Varianten hat, wird
konsistent die kürzere Form als Stamm gewählt.

Beispiele:
        
        Ein#famil~ie\n#haus
        Büch\er#bus
        Fried~e\ns#freund


Vor einem Suffix wird immer das Fugenelement getrennt, das das
Suffix voraussetzt und dessen Form entweder vom Suffix oder von der
Deklinationsklasse des Wortes determiniert wird.

Beispiele:

        glück~lich\er~weise
        Griech~e\n~tum



2.5.4. Suffixe

2.5.4.1. Substantivische Suffixe

Heimische Suffixe:

~er     Lehr~er
~ler    Mensch\en|recht~ler
~ner    Rent~ner
~ling   Günst~ling
~e/f    Eben~e
~e/m    Griech~e
~sel    Mit|bring~sel
~el/m   Deck~el
~el/nt  Acht~el
~el/f   Form~el
~ei     Blödel~ei
~erei   Ras~erei
~nis    Erlaub~nis
~ung    Aus|üb~ung
~heit   Dumm~heit
~schaft Mann~schaft
~tum    König~tum
~igkeit An|spruch\s~los~igkeit
~keit   Zwei|sprach~ig~keit
~icht   Birk~icht
~sal    Müh~sal
~tel/~stel Vier~tel
~chen   Tür~chen
~in     Lehr~er~in
~lein   Heft~lein
~bold   Witz~bold
~ian    Dummr~ian


Fremdsuffixe:

~an     Kastell~an
~ant    Fabrik~ant
~ent    Dirig~ent
~ast    Phant~ast
~ar     Bibliothek~ar
~är     Legion~är
~arier  Prolet~arier
~ator   Agit~ator
~and    Diplom~and
~eur    Mass~eur
~ist    Kompon~ist
~ier    bank~ier
~ade    Promen~ade
~at     Konsul~at
~ität   Lokal~ität
~ur     Kommandant~ur
~arium  Ros~arium
~enz    Resid~enz
~erie   Drog~erie
~ee     Gel~ee
~ament  Fund~ament
~ment   Invest~ment
~esse   Delikat~esse
~age    Karton~age
~alien  Musik~alien
~atur   Muskul~atur
~iar    Mobil~iar
~iat    Proletar~iat
~ik     Motiv~ik
~aille  Gener~aille
~al     Person~al
~ing    Train~ing
~ismus  Patriot~ismus
~ion    Diskret~ion
~ement   Bombard~ement
~or     Edit~or
~ör     Fris~ör
~it     Band~it
~ante   Diskrimin~ante
~ente   Tang~ente
~iade   Spartak~iade
~asmus  Enthusi~asmus

~ateur  dekor~ateur
~ation  inform~ation
~ie     famil~ie
~ient   abitur~ient
~iteur  akquis~iteur
~ition  invest~ition
~itor   defin~itor
~anz    domin~anz
~atik   problem~atik
~atist  kompar~atist
~ativum appell~ativum
~atum   desider~atum
~elchen bäch~elchen
~elei   wink~elei
~end    substrah~end
~euse   fris~euse
~iation denunz~iation
~iatur  lin~iatur
~iker   alkohol~iker
~ikum   kosmet~ikum
~iment  sort~iment
~itur   invest~itur
~ivum   reflex~ivum
~onik   architekt~onik
~orium  provis~orium
~ose    a|vitamin~ose
~ariat  prolet~ariat


2.5.4.2. Adjektivische Suffixe

Heimische Suffixe:

~bar    brauch~bar
~lich   weib~lich
~haft   fabel~haft
~ig     berg~ig
~los    an|spruch\s~los
~mäßig  schül~er~mäßig
~isch   melod~isch
~sam    arbeit~sam
~en     gold~en
~n      kupfer~n
~ern    eis~ern
~er     zwanzig~er
~fach   zwei~fach
~lei    zwei\er~lei


Fremdsuffixe:

~al     funft~ion~al
~ell    form~ell
~iv     produkt~iv
~os     lepr~os
~ar     pol~ar
~är     segment~är
~ant    domin~ant
~ent    differ~ent
~abel   akzept~abel
~esk    ballad~esk
~ial    kolleg~ial
~iös    graz~iös
~ös     por~ös
~iell   bakter~iell
~itiv   defin~itiv
~uell   grad~uell
~arisch statut~arisch
~atisch problem~atisch
~ativ   affirm~ativ
~iär    famil~iär
~itär   autor~itär
~onisch architekt~onisch
~orisch provis~orisch
~ual    prozent~ual
~uös    inzest~uös



2.5.4.3. Adverbiale Suffixe

~dings    neu\er~dings
~ens      best~ens
~halben   meinet~halben
~halber   ordn~ung\s~halber
~lings    füß~lings
~mals     noch~mals
~maßen    an|er|kannt\er~maßen
~s        abend~s
~wärts    berg~wärts
~weg      schlecht~weg
~weise    läch\er~lich\er~weise
~lich     elendig~lich
~ends     voll~ends
~falls    gleich~falls
~halb     unter~halb
~seits    berg~seits
~wegen    des~wegen



2.5.4.4. Verbale Suffixe

~ier       buchstab~ier~en
~el        läch~el~n
~is~ier    signal~is~ier~en
~ifiz~ier  person~ifiz~ier~en
~ig        end~ig~en



2.6. DIE WICHTIGSTEN TWOL-REGELN


GERTWOL enthält etwa 20 TWOL-Regeln. Die wichtigsten
Zwei-Stufen-Regeln in GERTWOL steuern die folgenden Phänomene:

-die e-Erweiterung im IND PRÄS SG2/3 und PL2, IMP PRÄS PL2, IND PRÄT
 und PART PERF bei schwachen Verben, deren Stamm entweder auf -d
 oder -t endet oder auf -m oder -n ausgeht, vor dem ein anderer
 Konsonent (kein -l oder -r) steht.


Beispiele:

        reden --> redete (nicht: redte)
        atmen --> atmete (nicht: atmte)


-die e-Tilgung im INF, IND PRÄS PL1/3, KONJ PRÄS SG2 und PL bei
 schwachen Verben, die auf -eln oder -ern ausgehen

Beispiel:

        handeln (nich: handelen)


-die e-Tilgung im INF, IND/KONJ PRÄS PL1/3, IND/KONJ PRÄT PL1/3 nach
 einem Vokal oder nach h in den auf -en ausgehenden Konjugationsendungen

Beispiel:

        freuen/freun (jedoch: knien)


-der n-Schwund im PL DAT bei auf -n ausgehenden Substantiven

Beispiel:

        Laden --> Läden (nicht: Lädenn)


-der Konsonantenschwund (s) bei Verben, die auf einen s-Laut ausgehen
 im IND PRÄS SG2

Beispiel:

        rasen --> rast (nicht: rasst)


-der Konsonantenschwund (bei Verben mit Umlaut oder e/i-Wechsel) im
  IND PRÄS SG2/3

Beispiel:

        halten --> hält (nicht: hältt)


-Umlautung bei Substantiven

Beispiele:

        Mann, Männer
        Sohn, Söhne
        Buch, Bücher
        Baum, Bäume


-die Rechtschreibung an der Nahtstelle in Komposita (drei Konsonanten)

Beispiele:

        Schnitt + Tulpe --> Schnittulpe
        Sauerstoff + Flasche --> Sauerstoffflasche


-die Rechtschreibung des ss/ß

Beispiele:

        Kuß/Küsse
        vermissen/vermißt




3. SCHLUSSBEMERKUNGEN


Die künftigen Vorhaben bezüglich GERTWOL:


        -Silbentrennung

        -lokale Disambiguation

        -Valenzangaben

        -Oberflächensyntax-Analyse

        -Satzglied-Lemmatisierung
        



Literaturverzeichnis



THE COLLINS GERMAN DICTIONARY Neubearbeitung Stuttgart 1991.

Bußmann, Hadumod Lexikon der Sprachwissenschaft Stuttgart 1983.

Duden Die Grammatik Mannheim 1984.

Duden Deutsche Rechtschreibung Mannheim 1991.

Duden Richtiges und gutes Deutsch Mannheim 1985.

Flämig, Walter Grammatik des Deutschen Berlin 1991.

Fleischer, Wolfgang, Irmhild Barz Wortbildung der deutschen
        Gegenwartssprache Tübingen 1992.

Grube, Henner Die Fugenelemente in neuhochdeutschen Komposita
        In:Sprachwissenschaft 1 1976 187 - 222.

Helbig, Gerhard; Joachim Buscha Deutsche Grammatik Ein Handbuch für
        den Ausländerunterricht Berlin 1991.

Karlsson, Fred SWETWOL: A Comprehensive Morphological Analyser for
        Swedish. In: Nordic Journal of Linguistics, 15, 1-45.

Koskenniemi, Kimmo TWO-LEVEL morphology: A General Computational Model
        for Word-Form Recognition and Production Helsinki 1983.

Rackow, Ulrike Of the Treatment of Compounds in Machine Translation. A
        Study IWBS Report 1992.

Rackow, Ulrike Ido Dagan, Ulrike Schwall COLING -92 Automatic
        Translation of Noun Compounds 1992.

Wellmann, Hans, Nikolaus Reindl Annemarie Fahrmaier Zur
        morphologischen Regelung der Substantivkomposita im heutigen Deutsch
        In: Deutsche Philologie Band 93 Heft 3 1974.

Wurzel, W.U., Studien zur deutschen Lautstruktur. Berlin 1970.




GERTWOL-TAGSET

 SELTEN
 VERALTET
 GESPROCHEN
 HÖFLICH

 ABK            Abkürzung                       geb.

 A              Adjektiv

 ADV            Adverb                          dort

 ART            Artikel                         ein

 DEF            bestimmt                        der

 INDEF          unbestimmt                      ein


 INTERJ         Interjektion                    ah

 iKONJ          Infinitivkonjunktion            zu
 nKONJ          nebenordnende Konjunktion       und
 sKONJ          Satzteilkonjunktion             als
 uKONJ          unterordnende Konjunktion       ob


 NUM            Numerale

 KARD           Kardinalzahl                    eins
 ORD            Ordinalzahl                     zweiter
 BRUCH          Bruchzahl                       viertel
 RÖM            römische Zahl                   III

 A(PART)        adjektiviertes Partizip         gemachtes

 pre            vorgestellt                     in
 post           nachgestellt                    halber

 PRÄP           Präposition                     durch

 Akk            mit Akkusativ                   durch
 Dat            mit Dativ                       mit
 Gen            mit Genitiv                     trotz

 PRON           Pronomen

 poss           Possessivpronomen               mein
 refl           Reflexivpronomen                dich
 rez            reziprok                        einander

 PERS           Personalpronomen                ich
 DEM            Demonstrativpronomen            dieser
 RELAT          Relativpronomen                 denen
 INTERROG       Interrogativpronomen            wer
 INDEF          Indefinitpronomen               einige
 NEG            negativ                         kein

 (Det)          determinativ                    kein

 PRONADV        Pronominaladverb                daran

 S              Substantiv                      Kind

 S(A)           Substantiviertes Adjektiv       Gutes
 S(PART)        Substantiviertes Partizip       Gemachtes

 V              Verb

 TRENNBAR       trennbar                        abkommen

 IND            Indikativ                       läuft
 KONJ           Konjunktiv                      komme
 IMP            Imperativ                       komm

 INF            Infinitiv                       sehen
 PART           Partizip                        laufend

 PRÄS           Präsens
 PRÄT           Präteritum

 PERF           Perfekt

 SG1            1. Pers. Singular
 SG2            2. Pers. Singular
 SG3            3. Pers. Singular

 PL1            1. Pers. Plural
 PL2            2. Pers. Plural
 PL3            3. Pers. Plural

 zu             Verbform mit "zu"               anzukommen
 es             Verbform mit "es"               geht's

 PRÄF           trennbares Präfix               ein

 EIGEN          Eigenname

 Famname        Familienname                    Goethe

 Vorname        Vorname                         Johann

 POS            Positiv                         gut
 KOMP           Komparativ                      besser
 SUP            Superlativ                      beste
 SUP2           Superlativ 2                    (am) besten

 INV            indeklinabel                    beige

 SG             Singular
 PL             Plural
 SG/PL          Singular oder Plural

 NOM            Nominativ
 AKK            Akkusativ
 DAT            Dativ
 GEN            Genitiv

 FEM            Femininum
 MASK           Maskulinum
 NEUTR          Neutrum

 ERSTGLIED      Erstglied

  #             Starke Kompositionsgrenze       Wört\er#buch
  |             Schwache Kompositionsgrenze     zwei|händ~ig
  \             Fugenelement
  ~             Suffix

  KOMMA
  PUNKT
  DOPPELPUNKT
  KLAMMER
  PROZENTZEICHEN
  FRAGEZEICHEN
  SEMIKOLON
  SCHRÄGSTRICH
  AUSRUFEZEICHEN
  BINDESTRICH
  ANFÜHRUNGSZEICHEN
  GEDANKENSTRICH
  PARAGRAPHZEICHEN
  STERN-ZEICHEN
  PLUS-ZEICHEN
  MINUS-ZEICHEN
  GLEICHHEITSZEICHEN
  NUMMERNZEICHEN
  ET-ZEICHEN
  AUSLASSUNGSPUNKTE


Martin Volk
Date of last modification:
Source: http://www.ifi.unizh.ch