Wortbildung: Komposition und Derivation

Morphologieanalyse und Lexikonaufbau (3. Vorlesung)

Dozent: Gerold Schneider

Übersicht


Abgrenzung der Wortbildung

nach [Fleischer und Barz 95]: Wortbildung wird abgegrenzt einerseits von der Wortformen-Bildung, der Flexion, und andererseits von der Wort-Schöpfung.

Abgrenzung zur Flexion

Abgrenzung zur Wort-Schöpfung

Wortbildung
ist die Produktion von Wörtern auf der Grundlage und mit Hilfe vorhandenen Sprachmaterials.
Wortschöpfung
besteht darin, dass Wörter aus Lauten geschaffen werden, die (noch) nicht bedeutungstragend in der Sprache existieren.

Wortschöpfung ist sehr selten und tritt vor allem auf bei schallnachahmenden Bildungen.

bimmeln, poltern, quieken, plumsen

Arten der Wortbildung

1. Komposition

Def.: Zusammenfügung von zwei oder mehr Kernmorphemen (oder Kombinationen aus KM und anderen Morphemen) zu einem Kompositum, wobei in der Regel das letzte Glied sowohl die Wortart als auch die Flexionsklasse bestimmt.

Muster:

N + N : (häufig)        Bierflasche, Lebensversicherung
A + N : (weniger)       Breitwand, Grossmaul, Freibrief
V + N : (weniger)       Waschmaschine
N + A : (weniger)       pfeilschnell, vogelfrei
V + A : (weniger)       stinkfaul
V + V : (selten)        kennenlernen
A + V : (selten)        weitspringen

Kompositum

Unterschiede in der Linguistik (semantische Ebene):

determinative Komposita (häufig):
das zweite Glied wird durch das erste näher bestimmt:
Hochhaus vs. haushoch; 
Hausfrau vs. Frauenhaus

Dabei bestehen zwischen den Kompositionsgliedern sehr unterschiedliche Relationen ([Fleischer und Barz 95]: 98-99 unterscheiden beispielsweise für N-N Kompositionen 17 davon), wie etwa:

lokal: Büroarbeit
temporal: Tagesfahrt
final: Hundeflocken
material: Weizenflocken
komparativ: Goldorange
agentiv: Bienenhonig
konstitutional: Blumenstrauss
kopulative Komposita (selten):
die einzelnen Teile fügen sich addierend zu einem neuen Ganzen:
blaugrün, taubstumm, Strumpfhose
'possessive' Komposita (selten):
eine Person oder ein Gegenstand wird nach charakteristischen Teilen benannt (meist idiomatisierte Verbindungen):
Graukopf, Lästermaul, Grossschnauze, Heisssporn, Schlafmütze
Partikelkomposition (selten):
Komposition jenseits der obigen Muster mit z.B. Partikelmorphemen; historisch meist produktiver:
Ohnmacht, Antwort, Aberglaube
Eine weitere geläufige Unterscheidung ist die zwischen endozentirschen und exozentrischen Komposita:
Bei endozentrischen (häufiger, z.B. determinative und oft kopulative Komposition) liegt die Bedeutung des Kompositums kompositional innerhalb der Schnittmenge der Bedeutung der Kompositionsglieder.
     hochhaus(X) :- hoch(X), haus(X). 
     bueroarbeit(X) :- buero(Y), lokalrelation(Y,X), arbeit(X).
Bei exozentrischen (selten, viele Idiome, aber auch kopulative Komposita) funktioniert die Kompositionalität nicht; das Kompositum liegt ausserhalb der Schnittmenge der Kompositionsglieder.
     kleinkariert, Strumpfhose, Augenblick

2. Derivation

Def. (explizite Derivation): Zusammenfügung von einem Kernmorphem (oder einer KM-Kombination) mit einem Derivationsmorphem zu einem neuen Wort. Die Derivation (bes. Suffigierung) ändert oft die Wortart. Präfigierung wird oft getrennt behandelt (verändert stärker die Bedeutung aber weniger die syntaktischen Eigenschaften).

Muster (Suffigierung):

N -> A :        wissentlich, heilig
V -> A :        ausführbar, erklärlich, folgsam
A -> N :        Reichtum, Freiheit, Ewigkeit, Dichte, Feigling
N -> N :        Menschheit, Freundschaft, Briefchen, Köchin
V -> N :        Lehrer, Fahrer
A -> V :        bleichen, faulen, steinigen
N -> V :        gärtnern, knechten, schneidern, buchstabieren
V -> V :        säuseln, hüsteln

Wieviele Suffixe werden im Deutschen zur Derivation verwendet?

nach [Hoeppner 80] (S.55-57): > 73 Suffixe

-a	Propaganda, Thema
-abel	komfortabel
-ade	Blockade, Raffinade
-är	Sekretär, autoritär
-age	Staffage, Montage
-aille	Journaille
-al	dental, Journal
-ant	dissonant, Lieferant
-ar	Bibliothekar, insular
-asmus  Enthusiasmus, Sarkasmus
...
 

Leitlinien für die Zusammenstellung der Suffixliste:

  1. Anzahl soll im Interesse eines effizienten Identifizierungsverfahrens klein gehalten werden.
  2. Die deutsche Gegenwartssprache erfordert die Aufnahme von einigen Fremd- bzw. Lehnsuffixen (z.B. -age für Staffage, Montage, Blamage)
  3. fachsprachliche Suffixe wurden nicht aufgenommen (z.B. -id für Chlorid, Jodid in der Chemie)
  4. Unproduktive, nur wenig belegte Suffixe wurden nicht aufgenommen (z.B. -icht in Kehricht, Dickicht)
  5. Nur in Verbindung mit Eigennamen auftretende Suffixe werden nicht aufgenommen (z.B. -sche in Müllersche)
  6. Glieder, die nicht eindeutig Derivationssuffixe sind (sondern auch als Kompositionsglieder interpretiert werden können) werden nicht aufgenommen (z.B. -voll in mühevoll; -gut in Saatgut)
2.1. Spezielle Arten der Derivation

3. Andere Arten der Wortbildung

3.1. Rückbildung

eine Art Gegenteil der Derivation. Rückbildung ist "Derivation nicht durchg Hinzufügung, sondern durch Tilgung oder Austausch eines Wortbildungssuffixes mit gleichzeitiger Transposition in eine andere Wortart, wobei der Eindruck entsteht, das rückgebildete Wort sei die - kürzere - Ausgangsform" [Fleischer und Barz 95]: 51

Sanftmut   <- sanftmütig
notlanden  <- Notlandung
Elast      <- elastisch
Emanze     <- Emanzipation
3.2. Kurzwortbildung
Info       <- Information
Bus        <- Omnibus
Trafo      <- Transformator
Hifi       <- High Fidelity 
Frust      <- Frustration

häufig auch über Akronyme

LKW, km, Dr., km/h
3.3. Wortkürzung

von Wörtern innerhalb einer Wortfolge. Meistens bei Komposita.

Drittel  <- Dritt-Teil
3.4. Konversion

Wortartwechsel ohne Formveränderung

singen                  > das Singen
abgeordneter (Mann)     > Abgeordneter
3.5. Zusammenrückungen

von mehreren KM oder ganzen Wendungen (die letzte Konstituente gibt nicht die Wortart an)

Tunichtgut, Habenichts, Rührmichnichtan
3.6. Wortkreuzungen

Verschränkung von lexikalischen Einheiten

Instandbesetzung, Smog
3.7. Leihung

Häufig sind Wortleihen aus anderen Sprachen (zurzeit ist Englisch am einflussreichsten):

Homepage, Trottoir, Leasing, Shopville, a priori


Algorithmische Aspekte der Wortbildung

Sei W ein durch Komposition oder Derivation gebildetes Wort.

  1. Kann man W algorithmisch in seine Bestandteile zerlegen, also analysieren?
    für Komposition:
    1. Zerlegung möglich durch Abspaltung der Flexionsendung (evtl. Rückführung auf Stammform),
    2. Segmentierung von W in mögliche Glieder (und Fugenlaute) und
    3. Nachschlagen der Glieder im Lexikon.
      Bsp.:  Haustür, Arbeitszeit, Bierfässer, Krankenversicherung
    selten eindeutige semantische Beziehung (Bsp. Holzkiste)
     
    für Derivation:
    bei impliziter Derivation: nur über Lexikon
    Bsp.: Bund, Schritt

    bei expliziter Derivation: Zerlegung möglich durch Abspaltung der Präfixe bzw. Suffixe (geschlossene Liste) und Nachschlagen der Kernmorpheme im Lexikon.

    Bsp.: Krankheit, Lehrer, Freundschaft, Versicherung, Misserfolg

    (oft) klare semantische Beziehung

  2. Kann man für W algorithmisch entscheiden, ob es eine gültige Form der Sprache ist? (analog zu Flexion oder Satzsyntax)

    Im allgemeinen nicht! Wieso heisst es Reichtum (nicht Reichheit) aber Schönheit (nicht Schöntum)?

    Allerdings haben einige Derivationsmorpheme klaren semantischen Charakter und kommen vorzugsweise bei gewissen semantischen Klassen vor. Klare Beispiele sind Druck-er (+HUMAN) oder Vier-tel (+NUMERAL, von Teil). -tum kommt von mhd. Tuom (Herrschaft, Urteil, Ruhm, Ehe, Besitz) und wurde vorerst nur bei +HUMAN angewendet (Herzogtum, Banditentum, Unternehmertum), aber inzwischen verliert es dieses Charakteristikum (Reichtum, Heiligtum, Wachstum). Das mit einer verbalen Basis produktive Derivationsmorphem -ung kennt keine semantische Einschränkungen. Trotzdem lässt es sich nicht frei überall verwenden: *Tret-ung, *Geh-ung, *Abnehm-ung, *Erleb-ung etc.

  3. Kann man W algorithmisch generieren?

    für Komposition: Morphologisch kein Problem (bis auf Fugenelemente), jedoch semantisch problematisch!

    für Derivation: Nur wenn klar ist, welche Derivationssuffixe noch produktiv sind und mit welchen Kernmorphemen sie kombiniert werden können (siehe -er, -tum, -ung oben)

    Anmerkung: Nach Duden Grammatik (4. Auflage): "Rund ein Drittel der z.B. in einem durchschittlichen Zeitungstext vorkommenden Wortbildungen ist nicht in Wörterbüchern verzeichnet."

Hierzu ein einfaches Wortanalyseprogramm in Prolog.


Das SPERBER-Derivationsanalyse-System

(nach [Hoeppner 80]; Beispiel für ein frühes Analysesystem, das ohne Lexikon arbeitet.)

Idee: Eingabe ist ein Wort ohne Flexionsendung, dessen Wortartenzugehörigkeit bekannt ist. Zu ermitteln ist, ob das Wort mit Hilfe eines Derivationssuffixes gebildet wurde. D.h. Ziel ist die Isolierung des Stammes. Danach ist zu klären, wie das Genus und von welcher semantischen Art das Wort ist.

Skizze S. 63

Wort ::=        [Wortstamm]1  +         [Suffix]*
                Minimallänge            Kombinierbarkeit 
                                        spez. Restriktionen

Vorgehen:

Gegeben: Suffixe, Regeln für Kombinierbarkeit, Restriktionen

  1. längstes mögliches Suffix wird abgetrennt (verbleibende Minimallänge des Wortes: 3)
  2. mögliches Suffix hat Wortarteninfo, diese wird mit geg. Wortart abgeglichen. Bsp.:
    -chen --> Substantiv (Wörtchen       vs. schnarchen)
    -heit --> Substantiv (Gesundheit     vs. gescheit)
    -keit --> Substantiv (Übelkeit)
    -haft --> Adjektiv   (ernsthaft      vs. Einzelhaft)
    -lich --> Adjektiv   (heimlich)
    -sam  --> Adjektiv   (heilsam        vs. Balsam)
    -ar   --> Substantiv / Adjektiv  (Kommissar  vs.  atomar)
     
  3. bei mehreren möglichen Suffixen wird geprüft, ob diese zusammen (in dieser Reihenfolge) auftreten können.

    Bsp.: Verwu-nd-bar-keit wäre aufgrund der Suffixlisten möglich. Jedoch können -nd und -bar nie zusammen auftreten.

    ==> `Verwund-bar-keit'
  4. Spezifische Bedingungen für ein mögliches Suffix werden überprüft.

    Bsp.: -ung darf nicht auf Graphemfolge -pr folgen.

    ==> Ursprung enthält nicht das Suffix -ung.

    Bsp.: -ade darf nicht auf -l oder -m folgen.

    ==> Schublade und Made enthalten nicht das Suffix -ade.

    Anmerkung: Da die Umlaute in SPERBER durch ae, oe, ue umschrieben werden, ergeben sich Probleme, die bei direkter Repräsentation nicht auftreten.

    Bsp.: -el darf nicht auf -u folgen

    ==> Spuel-ung enthält nicht das Suffix -el.

  5. Umlautung des potentiellen Wortstamms wird überprüft (Umlautung bei den Derivationssuffixen kann nur bei -ur und -tum vorkommen und wird als allomorphe Form behandelt). Die folgenden Suffixe können Umlautung im Wortstamm auslösen:
    -chen, -e, -el, -en,  -er, -ig, -in, -isch, -lein, -lich, -ling, -nis, -ung.
     

    Da die Umlautung nicht immer auftritt, wird über eine Tabelle festgehalten, wann ein Umlaut zu reduzieren ist. Bsp.:

    gruen-lich ist nicht zu reduzieren: grün
    roet-lich ist zu reduzieren: rot

     

  6. Homographe Wortstämme werden über Suffixklassen disambiguiert.

    Bsp.: Reg-el-ung und Reg-ul-är gehören zur selben Suffixklasse, während Reg-ion zu einer anderen gehört.

    •  
    • Genusbestimmung bei nominalen Suffixen
      -ismus  --> MASK  (Pragmatismus)
      -ist    --> MASK  (Statist, Pessimist)
      -chen   --> NEUTR (Häuschen, Mäntelchen)
      -tum    --> NEUTR (Altertum, Abenteuertum; ausser: Reichtum)
      -ik     --> FEM   (Informatik, Statistik)
      -heit   --> FEM   (Krankheit, Gelegenheit)
      -keit   --> FEM   
       

      -- > ist nicht eindeutig möglich. Ist -er ein Derivationssuffix, so ist das Genus maskulin. Jedoch gibt es viele Wörter, die -er als Bestandteil des Wortstamms enthalten.

      Bsp.: Mask und Fem: Leiter

      Mask und Neutr.: Laster, Bauer

      Fem. und Neutr.: Steuer

      Wortklasse der Basis (nicht implementiert)

    • Semantik von (nominalen) Suffixen

      (Bei Nomen ist der semantische Gehalt der Derivation am klarsten erkennbar. Bei Adjektiven und Verben scheint die syntaktische Funktion der Derivation (= die Veränderung der Wortart) im Vordergrund zu stehen.) Grundlage ist eine heuristische semantische Ontologie mit 20 Merkmalbezeichnungen. Diese sind sehr heterogen. Während z.B. PERS (Personenbezeichnung) und EIGE (Eigenschaftsbezeichnung) sich ausschliessen, kann DIMN (Diminutiv) durchaus mit PERS oder LOKL (Lokalität) kombiniert werden. NEGT (Negation) ist gar nur für eine bestimmte Suffixkombination vorgesehen (-los-ig-keit).

      PERS                    ling            Feig-ling
      EIGE                    er-keit         Bitt-er-keit
      PERS; INST              ier-er          Prob-ier-er; Kop-ier-er
      (PERS; SACH) DIMN       el-chen         (Mäd-el; Steng-el) -chen

Nutzen der Derivationsanalyse


Zusammenfassung

  1. Zur Wortbildung gehören hauptsächlich Komposition (sehr produktiv im Deutschen) und Derivation. Daneben auch noch Rückbildung, Kurzwortbildung, Konversion, Zusammenrückungen und Wortkreuzungen.
  2. Ein Kompositum kann automatisch in seine Einzelteile zerlegt werden, wenn alle Kompositionsglieder bekannt sind. Dabei kommt es häufig zu Segmentierungsmehrdeutigkeiten (z.B. Ministern -> Minister+n oder Mini+Stern).
  3. Ein Derivativum kann automatisch in seine Einzelteile zerlegt werden, wenn Kern und Derivationsmorphem(e) bekannt sind. Dadurch können oft semantische Eigenschaften erkannt werden.
  4. Sowohl Komposita als auch Derivativa nehmen häufig eine eigenständige Bedeutung an, die sich nicht mehr unmittelbar aus ihren Bestandteilen herleiten lässt. Diese Wörter müssen dann selbst ins Lexikon eingetragen werden.


Gerold Schneider, Martin Volk
Date of last modification:
Source: http://www.ifi.unizh.ch