Morphologieanalyse und Lexikonaufbau (3. Vorlesung)
Dozent: Martin Volk
nach [Fleischer und Barz 95]: Wortbildung wird abgegrenzt einerseits von der Wortformen-Bildung, der Flexion, und andererseits von der Wort-Schöpfung.
der Neue, das Schreiben, der Besuch
Getreide-arten, Atem-züge, Rat-schläge
Wortschöpfung ist sehr selten und tritt vor allem auf bei schallnachahmenden Bildungen.
bimmeln, poltern, quieken, plumsen
Def.: Zusammenfügung von zwei oder mehr Kernmorphemen (oder Kombinationen aus KM und anderen Morphemen) zu einem Kompositum, wobei in der Regel das letzte Glied sowohl die Wortart als auch die Flexionsklasse bestimmt.
Muster:
N + N : (häufig) Bierflasche, Lebensversicherung A + N : (weniger) Breitwand, Grossmaul, Freibrief V + N : (weniger) Waschmaschine N + A : (weniger) pfeilschnell, vogelfrei V + A : (weniger) stinkfaul V + V : (selten) kennenlernen A + V : (selten) weitspringen
Kompositum
Unterscheide in der Linguistik (semantische Ebene):
Hochhaus vs. haushoch; Hausfrau vs. Frauenhaus
blaugrün, taubstumm, Strumpfhose
Graukopf, Lästermaul, Grossschnauze, Heisssporn, Schlafmütze
Ohnmacht, Antwort, Aberglaube
Def. (explizite Derivation): Zusammenfügung von einem Kernmorphem (oder einer KM-Kombination) mit einem Derivationsmorphem zu einem neuen Wort. Die Derivation (bes. Suffigierung) ändert oft die Wortart. Präfigierung wird oft getrennt behandelt (verändert stärker die Bedeutung aber weniger die syntaktischen Eigenschaften).
Muster (Suffigierung):
N -> A : wissentlich, heilig V -> A : ausführbar, erklärlich, folgsam
A -> N : Reichtum, Freiheit, Ewigkeit, Dichte, Feigling N -> N : Menschheit, Freundschaft, Briefchen, Köchin V -> N : Lehrer, Fahrer
A -> V : bleichen, faulen, steinigen N -> V : gärtnern, knechten, schneidern, buchstabieren V -> V : säuseln, hüsteln
Wieviele Suffixe werden im Deutschen zur Derivation verwendet?
nach [Hoeppner 80] (S.55-57): > 73 Suffixe
-a Propaganda, Thema -abel komfortabel -ade Blockade, Raffinade -är Sekretär, autoritär -age Staffage, Montage -aille Journaille -al dental, Journal -ant dissonant, Lieferant -ar Bibliothekar, insular -asmus Enthusiasmus, Sarkasmus ...
Leitlinien für die Zusammenstellung der Suffixliste:
Misserfolg, Unschuld, versprechen, durchfahren, darstellen
bind(en) => Bund, Band schreit(en) => Schritt zieh(en) => Zug
von kürzeren Wörtern aus längeren
Info <- Information elend <- elendiglich Schirm <- Regenschirm Bus <- Omnibus
über Akronyme
LKW, km, Dr., km/h
von Wörtern innerhalb einer Wortfolge. Meistens bei Komposita.
Drittel <- Dritt-Teil
Wortartwechsel ohne Formveränderung
singen > das Singen abgeordneter (Mann) > Abgeordneter
von mehreren KM oder ganzen Wendungen (die letzte Konstituente gibt nicht die Wortart an)
Tunichtgut, Habenichts, Rührmichnichtan
Verschränkung von lexikalischen Einheiten
Instandbesetzung, Smog
Sei W ein durch Komposition oder Derivation gebildetes Wort.
Zerlegung möglich durch Abspaltung der Flexionsendung (evtl. Rückführung auf Stammform), Segmentierung von W in mögliche Glieder (und Fugenlaute) und Nachschlagen der Glieder im Lexikon.
Bsp.: Haustür, Arbeitszeit, Bierfässer, Krankenversicherung
selten eindeutige semantische Beziehung (Bsp. Holzkiste)
bei impliziter Derivation: nur über Lexikon
Bsp.: Bund, Schritt
bei expliziter Derivation: Zerlegung möglich durch Abspaltung der Präfixe bzw. Suffixe (geschlossene Liste) und Nachschlagen der Kernmorpheme im Lexikon.
Bsp.: Krankheit, Lehrer, Freundschaft, Versicherung, Misserfolg
(oft) klare semantische Beziehung
Im allgemeinen nicht! Wieso heisst es Reichtum (nicht Reichheit) aber Schönheit (nicht Schöntum)?
Komposition: Morphologisch kein Problem (bis auf Fugenelemente), jedoch semantisch problematisch!
Derivation: Nur wenn klar ist, welche Derivationssuffixe noch produktiv sind und mit welchen Kernmorphemen sie kombiniert werden können.
Anmerkung: Nach Duden Grammatik (4. Auflage): "Rund ein Drittel der z.B. in einem durchschittlichen Zeitungstext vorkommenden Wortbildungen ist nicht in Wörterbüchern verzeichnet."
(nach [Hoeppner 80]; Beispiel für ein frühes Analysesystem, das ohne Lexikon arbeitet.)
Idee: Eingabe ist ein Wort ohne Flexionsendung, dessen Wortartenzugehörigkeit bekannt ist. Zu ermitteln ist, ob das Wort mit Hilfe eines Derivationssuffixes gebildet wurde. D.h. Ziel ist die Isolierung des Stammes. Danach ist zu klären, wie das Genus und von welcher semantischen Art das Wort ist.
Skizze S. 63
Wort ::= [Wortstamm]1 + [Suffix]* Minimallänge Kombinierbarkeit spez. Restriktionen
Vorgehen:
Gegeben: Suffixe, Regeln für Kombinierbarkeit, Restriktionen
-chen --> Substantiv (Wörtchen vs. schnarchen) -heit --> Substantiv (Gesundheit vs. gescheit) -keit --> Substantiv (Übelkeit) -haft --> Adjektiv (ernsthaft vs. Einzelhaft) -lich --> Adjektiv (heimlich) -sam --> Adjektiv (heilsam vs. Balsam) -ar --> Substantiv / Adjektiv (Kommissar vs. atomar)
Bsp.: Verwu-nd-bar-keit wäre aufgrund der Suffixlisten möglich. Jedoch können -nd und -bar nie zusammen auftreten.
==> `Verwund-bar-keit'
Bsp.: -ung darf nicht auf Graphemfolge -pr folgen.
==> Ursprung enthält nicht das Suffix -ung.
Bsp.: -ade darf nicht auf -l oder -m folgen.
==> Schublade und Made enthalten nicht das Suffix -ade.
Anmerkung: Da die Umlaute in SPERBER durch ae, oe, ue umschrieben werden, ergeben sich Probleme, die bei direkter Repräsentation nicht auftreten.
Bsp.: -el darf nicht auf -u folgen
==> Spuel-ung enthält nicht das Suffix -el.
-chen, -e, -el, -en, -er, -ig, -in, -isch, -lein, -lich, -ling, -nis, -ung.
Da die Umlautung nicht immer auftritt, wird über eine Tabelle festgehalten, wann ein Umlaut zu reduzieren ist. Bsp.:
gruen-lich ist nicht zu reduzieren: grün
roet-lich ist zu reduzieren: rot
Bsp.: Reg-el-ung und Reg-ul-är gehören zur selben Suffixklasse, während Reg-ion zu einer anderen gehört.
-ismus --> MASK (Pragmatismus) -ist --> MASK (Statist, Pessimist) -chen --> NEUTR (Häuschen, Mäntelchen) -tum --> NEUTR (Altertum, Abenteuertum; ausser: Reichtum) -ik --> FEM (Informatik, Statistik) -heit --> FEM (Krankheit, Gelegenheit) -keit --> FEM
-- > ist nicht eindeutig möglich. Ist -er ein Derivationssuffix, so ist das Genus maskulin. Jedoch gibt es viele Wörter, die -er als Bestandteil des Wortstamms enthalten.
Bsp.: Mask und Fem: Leiter
Mask und Neutr.: Laster, Bauer
Fem. und Neutr.: Steuer
Wortklasse der Basis (nicht implementiert)
(Bei Nomen ist der semantische Gehalt der Derivation am klarsten erkennbar. Bei Adjektiven und Verben scheint die syntaktische Funktion der Derivation (= die Veränderung der Wortart) im Vordergrund zu stehen.) Grundlage ist eine heuristische semantische Ontologie mit 20 Merkmalbezeichnungen. Diese sind sehr heterogen. Während z.B. PERS (Personenbezeichnung) und EIGE (Eigenschaftsbezeichnung) sich ausschliessen, kann DIMN (Diminutiv) durchaus mit PERS oder LOKL (Lokalität) kombiniert werden. NEGT (Negation) ist gar nur für eine bestimmte Suffixkombination vorgesehen (-los-ig-keit).
PERS ling Feig-ling EIGE er-keit Bitt-er-keit PERS; INST ier-er Prob-ier-er; Kop-ier-er (PERS; SACH) DIMN el-chen (Mäd-el; Steng-el) -chen
Ärztin -> belebtes Objekt Krankkeit -> EigenschaftMit dieser Information kann z.B. die Subjekt-Objekt Mehrdeutigkeit im folgenden Satz eliminiert werden, wenn man weiss, dass das Verb bemerken ein belebtes Subjekt fordert.
Diese Krankheit hat eine junge Ärztin zuerst bemerkt, als sie ...