GPSG für das Deutsche - konstruktive Variante

Dozent: Martin Volk

Übersicht

In Vorlesung 7 wurde eine GPSG für das Deutsche vorgestellt, die auf [Uszkoreit 87] basierte. Zu diesem Entwurf gab es Kritik bzgl.

Praktischer Einsatz von GPSG


Mittelfeldordnung

In [Hauenschild 87] wird darauf hingewiesen, dass die von Uszkoreit vorgeschlagene komplexe LP-Regel die Verhältnisse im Mittelfeld eines deutschen Satzes nur unzureichend widergibt. So wird bemängelt, dass die unmarkierte Reihenfolge inkorrekt ist, wenn alle NPs pronominalisiert sind.

Sie gab es ihm.                   (Akk < Dat)
Sie gab dem Jungen das Buch.      (Dat < Akk)

Hauenschild schlägt deshalb folgende Revision vor:

[Case Nom]             < [Case Dat]
[Case Nom]             < [Case Acc]
[Case Dat, -PersPron]  < [Case Acc, -PersPron]
[Case Acc, +PersPron]  < [Case Dat, +PersPron]
[-Focus]               < [+Focus]
[+PersPron]            < [-PersPron]

Weitere Anmerkungen von Hauenschild zur unmarkierten Reihenfolge:

Vorschlag von Hauenschild: Die LP-Bedingungen für das Mittelfeld im Rahmen der Syntax ganz fallenlassen und auf einer semantisch-pragmatischen Ebene lösen.

Konstituente(n) im Vorfeld

Kurze Zeit nach Veröffentlichung seiner Arbeit über GPSG hat Uszkoreit selbst die Annahme in Frage gestellt, dass immer nur eine Konstituente vor dem finiten Verb stehen kann (s. [Uszkoreit 87b]).

[Unbemerkt seine Brieftasche stehlen] kannst Du ihm nur in der Oper.

In diesem Beispiel stehen vor dem finiten (Modal-)verb: ein Adverb, das direkte Objekt und das nicht-finite Hauptverb. Weitere Beispiele:

[Den Brief zustecken] sollte der Kurier nachher einem Spion.
[Nachher einem Spion zustecken] sollte der Kurier den Brief.

Beobachtung: Das Nicht-finite Verb kann zusammen mit einigen (nie allen) Komplementen und Adjunkten in das Vorfeld verschoben werden. Es ist fraglich, inwieweit das Subjekt mit dem nicht-finiten Verb im Vorfeld stehen kann.

?? [Der Kurier zustecken] sollte den Brief nachher einem Spion.
   [Ein wirklicher Fehler unterlaufen] war ihm noch nie.

Es entstehen also zwei Probleme:

  1. Wie gelangen mehrere Konstituenten ins Vorfeld?
  2. Wie ist die Reihenfolge der Konstituenten im Vorfeld?

Wenn man Topikalisierung über das Slash-Merkmal beschreibt, so kann man immer nur eine Konstituente bewegen. Als Alternative wurde vorgeschlagen, Listen als Werte für das Slash-Merkmal zuzulassen. Jedoch müsste man dann die Regel aufgeben, wonach im Deutschen immer nur eine Konstituente im Vorfeld steht. Um diese Annahme zu halten, muss man davon ausgehen, dass die Konstituenten im Vorfeld eine Konstituente bilden.

Uszkoreits Beobachtung: Die Reihenfolge der Elemente im Vorfeld ist nur festzulegen zusammen mit den zurückgelassenen Konstituenten. These: Die Reihenfolge der herausbewegten Elemente entspricht der Reihenfolge an der ursprünglichen Position.

   Darum hatte der Spion ihn dem Kurier aus der Tasche gezogen.
   Dem Kurier aus der Tasche gezogen hatte der Spion ihn.
?? Ihn aus der Tasche gezogen hatte der Spion dem Kurier.

Problem: GPSG bietet keine Möglichkeit, eine geordnete Sequenz von Konstituenten zu bewegen.

Da sich LP-Regeln immer nur auf Geschwisterknoten beziehen, kann auch keine LP-Bedingung formuliert werden, die an verschiedenen Positionen im Baum ansetzt.

Ausweg: Ein Formalismus, bei dem die Reihenfolge in der Subkat-Liste im Lexikon festgelegt wird (und nicht mehr in den LP-Regeln). Dies wird z.B. in HPSG so gemacht.

MC-Merkmal

In ihrer Rezension zu [Uszkoreit 87] kritisieren [Hinrichs und Nakazawa 89], dass das MC-Merkmal nur als technischer Trick verwendet wird, um die ECPO-Eigenschaft der Grammatik herzustellen.

However, unless the feature [MC] is well motivated on independent syntactic grounds, the claim that all natural languages can be described by phrase structure grammars that induce ECPO is in danger of becoming vacuous, since violations of ECPO can always be explained away through the use of some arbitrary distingushing syntactic feature.

Desweiteren wird dort kritisiert, dass jedes Verb im Lexikon zweifach auftreten muss und zwar einmal mit [+MC] und einmal mit [-MC], damit die LP-Regeln für die Verbstellung angewendet werden können.

Das erscheint mir jedoch unberechtigt. Wenn die Grammatik dafür sorgt, dass das MC-Merkmal bei V0 immer belegt ist, kann die (unmotivierte) Spezifikation dieses Merkmals im Lexikon entfallen.

Abtrennbare Verbpräfixe

Uszkoreit hat bei der Behandlung von abtrennbaren Verbpräfixen unterschlagen, wie der starke Infinitiv (Infinitiv mit zu) beschrieben werden soll.

Er versprach, um 5 Uhr [zu kommen].
Er will um 5 Uhr kommen.
Er versprach, ihn am Bahnhof [abzuholen].
Er will ihn am Bahnhof abholen.

Während der starke Infinitiv bei Verben ohne abtrennbaren Präfix syntaktisch behandelt werden muss, muss er bei Verben mit abtrennbarem Präfix als morphologisches Phänomen beschrieben werden. Mein Vorschlag ist, den Infinitivmarker zu über eine Metaregel einzuführen. Dazu müsste zunächst Uszkoreits Metaregel zur Einführung des abtrennbaren Verbpräfixes leicht modifiziert werden:

V2[-Aux] --> W
  >==>
V2[Pref y] --> W, SepPref[Pref y]    
      mit y aus {ab, an, ein, ..., zu}

Das binärwertige Merkmalschema +y wurde ersetzt durch das Merkmal Pref, das als Wert ein Element aus der Liste aller möglichen Präfixe erhält. Diese Änderung erlaubt eine einfache Unterscheidung zwischen einer V2, die ein abtrennbares Verbpräfix enthält und einer V2, die ein solches nicht enthält. Basierend darauf können wir die folgende Metaregel formulieren:

V2[~Pref]  --> W
  >==>
V2[Vform inf, +zu]  --> zu, W

Zusätzlich benötigen wir nur noch die LP-Regeln:

zu  <  V
X2  <  zu

Baum mit starkem Infinitiv

Baum mit starkem Infinitiv und abtrennbarem Verb

Kleine Verbumstellung

Bei Uszkoreits Regeln zur Reihenfolge innerhalb der Verbalgruppe wurde die sog. kleine Verbumstellung nicht berücksichtigt.

  obwohl er den Mann hätte sehen können
* obwohl er den Mann sehen können hätte

Durch die Schachtelung der Verbgruppe ist eine solche Umstellung auch schwierig zu integrieren. Vielleicht muss man eine ganz andere Struktur der VG annehmen.


Einsatz von GPSG in NLP-Systemen

Bei der Umsetzung von GPSG in ein ablauffähiges Programm zur Analyse bzw. Generierung von Sätzen ergeben sich eine Reihe von Problemen.

  1. Sollen die Metaregeln vor oder während der praktischen Anwendung der Grammatik eingesetzt werden?
  2. In welcher Reihenfolge werden Merkmalvererbungsprinzipien und -instanziierungsprinzipien sowie LP-Regeln eingesetzt?
  3. Können alle Teile von GPSG so implementiert werden, dass daraus effiziente Programme resultieren?
  4. Muss es unterschiedliche Regeln für Analyse bzw. Generierung geben?
  5. Wie muss ein Lexikon für eine GPSG aussehen?

Anwendung von Metaregeln

In den meisten praktischen Anwendungen wird davon ausgegangen, dass die Metaregeln in einer preprocessing-Phase eingesetzt werden und alle daraus entstehenden ID-Regeln zu Analyse und Generierung zur Verfügung stehen. Lediglich in [Weisweber und Preuss 92](WuP) findet sich ein Vorschlag zum Direct Parsing with Metarules. Dieser Vorschlag basiert auf einer Einschränkung der Metaregeln.

WuP argumentieren zunächst dahingehend, dass finite closure kein geeignetes Mittel zur Beschränkung der Mächtigkeit von Metaregeln ist. Begründung: Es gibt durchaus Fälle, wo eine Metaregel mehrfach auf eine ID-Regel angewendet werden muss, um adequate ID-Regeln zu erhalten. Beispiel: Bei [Gazdar et al. 85] gibt es eine Complement Omission Metaregel, die dafür sorgt, dass die Komplemente von Nomen und Adjektiven weggelassen werden können.

[+N, Bar1]  --> H, W
  >==>
[+N, Bar 1]  --> H

Zu der ID-Regel

(36) N1 --> H[36], PP[of], PP[to]       (gift)

wird durch diese Metaregel erzeugt:

(36') N1 --> H[36]                      (gift)

Damit kann also analysiert werden:

the [gift of John to Mary]
the [gift]

Es gibt jedoch keine Regel für den Fall, dass das Nomen mit nur einem seiner Komplemente auftritt. WuP schlagen deshalb eine veränderte Version der Complement Omission Metaregel vor. (X steht dabei für genau eine Kategorie.)

[+N, Bar1]  --> H, X, W
  >==>
[+N, Bar 1]  --> H, W

Diese Regel müsste jedoch mehrmals angewendet werden, um mehrere Komplemente `löschen' zu können. Das wird aber durch finite closure unterbunden.

Auch [Uszkoreit 87] weist auf Probleme mit dem finite closure-Prinzip hin. Er sucht nach einer Möglichkeit, mehrere Adverb-Phrasen in eine Satzstruktur einzubauen. Dazu müsste die folgende Metaregel mehrmals angewendet werden.

V2[-Aux]  --> H, W
  >==>
V2[-Aux]  --> H, W, AdvP

WuP anerkennen die Forderung nach Terminierung der Metaregel-Anwendung. Sie schlagen vor, finite closure durch folgende Einschränkung auf Metaregeln zu ersetzen. Eine Metaregel muss

Die geänderte Version der Complement Omission Metaregel genügt der ersten Restriktion und könnte somit `gefahrlos' mehrmals angewendet werden.

Die Anwendbarkeit der AdvP-Metaregel ist durch diese Einschränkungen jedoch noch nicht gewährleistet. WuP schlagen deshalb vor, die Metaregeln nicht vor dem Parsing (compile time) sondern erst während des Parsing (run time) anzuwenden. Realisiert man das Parsing datengetrieben, so kann man erreichen, dass jede Metaregel höchstens einmal für jedes Wort im Satz angewendet wird. Da man von Sätzen endlicher Länge ausgeht, ist eine beschränkte Anwendung der Metaregeln gewährleistet.

Die run time-Anwendung einer Metaregel unterliegt komplexen Bedingungen. Intuitiv gilt: eine Metaregel wird dann angewendet, wenn alle obligatorischen Kategorien der rechten Seite des Eingabemusters einer Metaregel erkannt wurden.

Anwendung der Prinzipien

Beim Einsatz von GPSG zum Parsen ist die Reihenfolge der Anwendung der verschiedenen Prinzipien unklar. Nach dem GPSG-Standard bietet sich ungefähr folgendes Bild ([Hauenschild und Busemann 88]):

What would it really amount to if we tried to implement the axiomatic version of GPSG in a straightforward way? In order to find all admissible trees corresponding to a given sentence, we would have to do the following things for every local tree:

After this, the subset of admissible local trees has to be identified which yields the desired complex structures ...

Dieses Vorgehen wäre hoffnungslos ineffizient. Gesucht ist deshalb eine Vorgehensweise bei der die einzelnen Prinzipien so eingesetzt werden, dass möglichst nur legale Strukturen aufgebaut werden. Das bezeichnet man als konstruktive Version von GPSG. Die grundlegende Idee: Die Prinzipien werden in festgelegter Reihenfolge angewendet und fügen jeweils Informationen hinzu. Folgende Reihenfolge wurde in einem Berliner GPSG-Projekt erarbeitet:

ID - FCR - FFP - FCR - AP - FCR - HFP - FCR - LP

Beachte:

Generierung mit GPSG

[Busemann 87] arbeitet mit der konstruktiven Version von GPSG. Er beschreibt detailliert, wie diese zur Erzeugung von Sätzen benutzt werden kann: `Aufgabe einer GPSG-basierten Generierungskomponente ist es, aus einer Ausgangsstruktur (AS) einen zulässigen syntaktischen Baum und daraus einen Satz zu erzeugen.' Jede AS enthält lexikalische Wörter und Merkmale. Beispiel für den Satz Diesen Satz werden die Kinder übersetzen können:

featspec(zweit:+, ac:+)
  lex(*verb_koennen*)
  lex(*futur*)
  embed
    lex(*verb_uebersetzen*)
    featspec(top:-, plu:+, cas:nom)
      lex(*det_def*)
      lex(*noun_kind*)
    featspec(top:+, plu:-, cas:acc)
      lex(*noun_satz*)
      lex(*det_dies*)

Gegeben seien die folgenden Grammatikregeln

(1) s[~slash, +zweit, +ac]   --> [+top, ~slash], s[fin, slash [+top]]
(2) s[fin]                   --> v[4, fin], s[inf]
(3) s                        --> v[2], s[inf]
(4) s[slash np[+top, acc]]   --> np[~slash, nom], v[6] 

AGR = {cas, plu}
FOOT = {slash}
HEAD = {cas, plu, vf}

Die Generierung des Baums beginnt mit der Auswahl von Regel (1) aufgrund der AS-Spezifikation der Merkmale Zweit und AC. Die S-Tochter wird mit Regel (2) expandiert. Im neuen lokalen Graphen wird das Futur-Hilfsverb verbalisiert und die S-Tochter mit Regel (3) expandiert, weil das Modalverb nur mit deren V-Tochter unifiziert. Die in der AS verbliebene `embed'-Konstituente wird als S verbalisiert, das nur durch Regel (4) expandiert werden kann. Der entstandene vierte lokale Baum nimmt das Hauptverb auf und erzwingt die Verbalisierung des dem Featspec mit [cas:nom] zugeordneten lexikalischen Materials.

Das AP transportiert nun [+plu] an den Mutterknoten, von wo sie zusammen mit [inf] durch die HFC an die Head-Tochter gelangt. Der Infinitiv folgt gemäss den LP-Aussagen als letzte Konstituente im lokalen Baum. Auch im 3. Graphen sind alle Tochterknoten abgearbeitet, und das FFP transportiert den slash-Wert der S-Tochter an den Mutterknoten. AP, HFC und LP wirken wie bei Graph 4. Am vollständig abgearbeiteten zweiten Graphen ergänzt dann das FFP den slash-Wert der Mutter und instanziiert damit auch die noch nicht bearbeitete Tochter im ersten lokalen Graphen. Das AP transporiert [+plu] an das finite Verb.

Das restliche Material aus der AS kann nun mit der verbleibenden Tochter in Graph 1 als NP verbalisiert werden, wodurch [-plu] an verschiedenen Stellen des Baumes instanziiert wird. AP und HFC wirken am Mutterknoten, und durch die LP-Regeln gelangt die [+top]-Konstituente an den Anfang.

Generierungsbaum


Übungssätze

Mein Vorschlag: Versuche folgende Sätze mit Hilfe der vorgestellten GPSG für das Deutsche zu analysieren. Füge bei Bedarf Regeln und Merkmale hinzu. Wir diskutieren mögliche Lösungen gemeinsam in der nächsten Vorlesung.

Der Vater weiss, dass Peter den Hund liebt.
Der Kandidat, der sich gestern vorstellte, hat keine Chance.
GPSG wurde seit Anfang der siebziger Jahre entwickelt mit dem Ziel, 
eine kontextfreie Theorie der Syntax zu haben.

Zusammenfassung

An der von [Uszkoreit 87] vorgeschlagenen GPSG für das Deutsche wurde verschiedentlich Kritik geübt. Sie betrifft vor allem die vorgesehene Ordnung der Konstituenten im Mittelfeld sowie die Besetzung des Vorfeldes.

In einem Berliner Projekt im Rahmen der EUROTRA-Forschung wurde die Eignung von GPSG für ein praktisches Übersetzungssystem untersucht. Fazit: Um GPSG praktisch einsetzen zu können, muss die deklarative Grammatik durch eine konstruktive Version ersetzt werden. Alle Prinzipien von GPSG müssen konstruktiv zum Aufbau von Strukturen beitragen. Die Anwendung von Metaregeln kann, wenn diese entsprechend eingeschränkt werden, auch zur Laufzeit erfolgen.


Martin Volk <volk@ifi.unizh.ch>
Date of last modification:
URL dieser Seite: http://www.ifi.unizh.ch