Wortformengenerierung

Morphologieanalyse und Lexikonaufbau (letzte Vorlesung)

Dozent: Martin Volk

Übersicht


Einsatz von Wortformengenerierung:

Einsatz von Paradigmengenerierung:


Generierung mit PC-Kimmo

PC-Kimmo ist ein System, das die Zwei-Ebenen-Morphologie von Kimmo Koskenniemi unterstützt. Es umfasst eine englische Morphologie-Komponente.

PC-KIMMO>generate 'try+ing
'try-ing
'trying

PC-KIMMO>generate 'try+ed
'try-ed
'tryed
'tried

PC-KIMMO>generate try+s
try-s
trys
tries

PC-KIMMO>generate fox+s
fox-s
foxes

PC-KIMMO>generate go+ed		% unregelmässige Formen werden nicht erzeugt ??
go-ed
goed

PC-KIMMO>generate run+ing 		% unerklärliches Verhalten
running
run-ing
runing

Das Systen 'ENDUNG'

Lit.: [Rausch und Rothe 94]

Eingabe: der Infinitiv eines deutschen Verbes

Ausgabe: alle Formen des Verbes (das Paradigma)

Platform: PC

Programmiersprache: Pascal

Entwickler: R. Rausch, H. Rothe (Uni Leipzig)

Auszeichnung: Deutsch-Österreichischer Hochschulsoftware-Preis 1993

Anwendung: Einbettung in ein Sprachlernprogramm

Abdeckung:

Algorithmus zur Formenanalyse der Eingabe

1. Analyse des Infinitivs

1.1 Analyse von rechts

Ziel: Abtrennung des Infinitivsuffixes

1.2 Analyse von links

1.2.1 Abtrennbare Präfixe

Ziel: Abtrennung des abtrennbaren Präfixes, auch wenn er komplex ist (z.B. übereinkommen, hinausgehen)

Ausgangspunkt: Liste aller einfachen Präfixe (> 100)

Probleme:

Einsilbigkeitsregel:

  1. Jede Basis eines deutschen Verbs enthält einen Nukleus: einen Vokal, einen Doppelvokal, ie oder einen Diphtong.
  2. Jede Basis eines deutschen Verbs enthält genau einen silbentragenden Vokal, Doppelvokal, ie oder Diphtong, d.h. die Basen deutscher Verben sind einsilbig. (Das in -ern oder -eln auftretende `e' zählt dabei nicht zur Basis.)

    Ausnahmen zu Regel 2:

1.2.2 Präfixe mit schwankendem Akzent

(Bsp.: `übersetzen vs über`setzen)

Tritt auf bei: durch-, hinter-, über-, um-, unter-, voll-, wider-, und wieder-

Listen:

Regel: Wenn der Präfix akzentuiert ist, dann ist er abtrennbar.

Abtrennbarkeit ist entscheidend für die Form des Partizip Perfekt und die Form des starken Infinitivs.

Merke: Auch nicht-abtrennbare Präfixe (be-, ent-, emp-, er-, ge-, ver-, zer-) müssen erkannt werden, um die Einsilbigkeitsregel einsetzen zu können.

(Ungelöstes) Problem:

Reihungen von Präfixen, die wieder enthalten:

... um den König wiedereinzusetzen   (Zusammenschreibung möglich!) 
... sie setzen den König wieder ein   (Zusammenschreibung unmöglich!) 
1.3 Zusammengesetzte Verben

Hier: Verben, die sich nicht entsprechend 1.2 behandeln lassen.

Lösung: Ausnahmeliste

vakuumbedampfen, autogenschweissen
1.4 Starke Verben

Mit der Basis wird überprüft, ob es sich um ein starkes (d.h. unregelmässig konjugiertes) Verb handelt.

Liste: alle Basen der starken Verben mit ihren Ablautreihen.

Problem: Verben, die mit dem Präfix ihre Flexion ändern. Lösung: Ausnahmeliste

stark: 		gleiten - 	glitt, 
		ausgleiten - 	glitt aus 
schwach: 	begleiten - 	begleitete
1.5 Partizip II mit oder ohne ge-

Regel: Das Partizip II ist mit ge- zu bilden, wenn der Infinitiv auf der ersten Silbe akzentuiert ist, sonst ist das Partizip II ohne ge- zu bilden.

Der Algorithmus leitet die Akzentuierung wie folgt her:

1.6 Besonderheiten
1.7 Die verwendeten Ausnahmelisten
1.8 Synthese der Formen

1.8.1 Anpassung der Basis wg Ablaut

Ablaut ist in Liste aufgeführt.

Regel: Lautet ein langer Vokal oder ein Diphtong auf einen kurzen ab, muss ein Dehnungs-h getilgt werden (falls vorhanden):

nehmen: ich nehme, du nimmst

Regel: Folgt dem Nukleus genau ein Konsonant in der Basis, so ist dieser zu verdoppeln.

treten: ich trete, du trittst, er tritt

Regel: Lautet ein kurzer Vokal auf einen langen Vokal oder einen Diphtong ab, sind doppelte Konsonanten durch einfache zu ersetzen.

schaffen: ich schuf

1.8.2 Formen des Indikativ Präsens

Paradigma:

ich ...-e		wir ...-en 
du ...-st		ihr ...-t 
er ...-t		sie ...-en 

Probleme:

1.8.3 Formen des Imperativs

Hauptschwierigkeit: Endungs-e unzulässig, fakultativ oder obligatorisch?

Regel: Verben, die in der 2.u.3. Sg. von e auf i oder ie ablauten, lauten auch im Imperativ ab und haben kein Endungs-e

treffen: er trifft, triff!
befehlen: er befiehlt, befiehl!

1.8.4 Partizipien

Das Partizip I wird aus dem Infinitiv abgeleitet:

1. -en bzw. -n wird von rechts abgetrennt

2. bei Verben auf -eln/-ern wird -nd angefügt, bei allen anderen -end.

Das Partizip II wird zusammengesetzt aus:

Die Verben brauchen, dürfen, können, lassen, mögen, müssen, sollen und wollen stehen im Perfekt und Plusquamperfekt als Infinitiv an Stelle des Partizip II, wenn sie mit einem anderen Infinitiv zusammentreffen.

Er hat das nicht gekonnt. 
Er hat nicht kommen können.

Das Verb werden bildet unterschiedliche Partizip II-Formen, wenn es als Hauptverb (Kopula) bzw. Hilfsverb gebraucht wird.

Er ist gross geworden.
Er ist gestern gesehen worden.
1.9 Reflexive Verben

Das Reflexivpronomen wird in Kongruenz mit der Person flektiert.

ich wundere mich, du wunderst dich, ... 
ich rege mich auf, du regst dich auf, ...

Problem: Unterscheidung zwischen Akkusativreflexivität und Dativreflexivität

Lösung: Typ muss vom Benutzer spezifiziert werden.

Beispiele:

Eingabe: sich wundern

Ausgabe: ich wundere mich, du wunderst dich, ...

Eingabe: sich3 etwas vorstellen

Ausgabe: ich stelle mir etwas vor, du stellst dir etwas vor, ...

1.10 Homographe Infinitive

Von Wörtern mit homographen Infinitiven werden alle Formen erzeugt.

schaffen: schuf/schaffte 
	(er schuf das Kunstwerk; er schaffte die Prüfung) 
schleifen: geschliffen/geschleift

2. Bewertung des Systems 'ENDUNG'

Idee: Das von Rausch/Rothe ermittelte Regelwissen in einen Zwei-Ebenen Formalismus übertragen und damit gleichermassen zur Analyse wie zur Generierung nutzbar zu machen.


Martin Volk
Date of last modification:
Source: http://www.ifi.unizh.ch