Einführung in HPSG

Dozent: Martin Volk

Übersicht

HPSG steht für Head-driven Phrase Structure Grammar. Trotz dieses Namens spielt die Phrasenstruktur eine untergeordnete Rolle in dieser Theorie. Ein besserer Name wäre Head-driven constraint-based grammar. HPSG wurde zuerst beschrieben in [Pollard and Sag 87], dann grundlegend überarbeitet und neu beschrieben in [Pollard and Sag 94].

Eine gute und ausführliche (~380 Seiten!) Einführung in HPSG für das Deutsche von Stefan Müller ist über das WWW erhältlich. Man kann auch Stefans HPSG Parser online ausprobieren.

Eine weitere wichtige Quelle: Die HPSG-Seite in Stanford.


Bereits eingeführte Fakten über HPSG

Die Grundannahmen von HPSG

In English: HPSG - Some leading ideas.


Die folgende Übersicht orientiert sich vor allem an [Brown 96] (S.191-196).

Bestandteile der HPSG-Theorie

Das grundlegende Konzept in HPSG ist die mathematisch-formale Modellierung linguistischer Einheiten. Die Theorie besteht aus Aussagen in einer formalen Sprache. HPSG besteht aus:

  1. Grammatik-Prinzipien
  2. Grammatik-Regeln
  3. Lexikon-Einträgen

Jede wohlgeformte Konstituente wird durch eine Merkmalstruktur beschrieben, und diese Merkmalstruktur muss von jedem Grammatik-Prinzip und zusätzlich von einer Grammatik-Regel oder einem Lexikon-Eintrag subsumiert werden. Die Grammatik-Prinzipien sind universell (d.h. sie gelten für alle Sprachen), ausser wenn sie explizit als sprach-spezifisch (engl. parochial) deklariert sind.

Das HPSG Zeichen 'sign'

Jede Konstituente, die durch eine HPSG-Grammatik zugelassen wird, ist eine Merkmalstruktur vom Typ 'sign'. Eine solche Merkmalstruktur enthält mindestens die Merkmale PHON und SYNSEM. Merkmalstrukturen, die Phrasen beschreiben, müssen ausserdem das Merkmal DTRS (daughters) enthalten, das unterteilt wird in HEAD-DTR und COMP-DTRS (complement daughters; eine Liste von Merkmalstrukturen, wo jedes Element ein Komplement beschreibt). Eine Phrase enthält somit immer eine Beschreibung aller Teile.

Die grundlegende Struktur eines Zeichens (nach [Müller 97] S. 22): Allgemeine AVM

Syntaktische Kategorien in HPSG

Das HEAD-Merkmal umfasst die Informationen, die ein Head und seine übergeordneten phrasalen Einheiten gemeinsam haben. (Beachte, dass es in HPSG deshalb anders als in GPSG nicht notwendig ist, die Merkmale in Head-Merkmale, Foot-Merkmale etc. zu unterteilen.) Zu diesen Informationen gehört:

Die Bedingung, dass Mutterknoten und Head-Tochter in den Head-Merkmalen übereinstimmen, wird durch das Head-Feature-Prinzip erreicht. Es gilt in HPSG als allgemeines Grammatik-Prinzip. Wir kennen das HFP von GPSG. In HPSG wird es jedoch so formuliert:

_                        _
| DTRS  headed-structure[]   |    ==>
-                        -
_                                                    _
| SYNSEM | LOC | CAT | HEAD  [1]                     |
| DTRS | HEAD-DTR | SYNSEM | LOC | CAT | HEAD  [1]   |
-                                                    -

In Worten: Jede Merkmalstruktur, in der das Merkmal DTRS vorkommt und zwar mit einer Merkmalstruktur vom Typ headed-structure als Wert, muss mit der Konsequenz dieser Implikation unifiziert werden. Die Konsequenz besagt mit Hilfe von Koreferenz-Symbolen, dass das HEAD-Merkmal (der Mutter) und das HEAD-Merkmal der Head-Tochter (HEAD-DTR) referenz-identisch sein müssen.

Subkategorisierung

Das SUBCAT-Merkmal enthält die Liste der fehlenden Valenzpartner einer Konstituente. Eine Merkmalstruktur, deren SUBCAT-Liste leer ist, hat keine Valenzforderungen. Das Subjekt ist genauso Bestandteil der SUBCAT-Liste wie etwaige Objekte. Die Elemente der SUBCAT-Liste sind geordnet nach dem Grad ihrer Wichtigkeit (engl. obliqueness). Das wichtigste Element (typischerweise das Subjekt) steht zuerst.

Das Subkategorisierungs-Prinzip sorgt dafür, das die SUBCAT-Liste 'abgearbeitet' wird.

_                        _
| DTRS  headed-structure[]   |    ==>
-                        -
_                                                                  _ 
| SYNSEM | LOC | CAT | SUBCAT  [2]                                 |
|      _                                                         _ |
| DTRS | HEAD-DTR | SYNSEM | LOC | CAT | SUBCAT  append([1],[2]) | |
|      | COMP-DTRS [1]                                           | |
|      -                                                         - |
-                                                                  -

In Worten: Die Subkategorisierungs-Anforderungen einer Phrase sind diejenigen der Head-Tochter abzüglich der bereits von den Komplement-Töchtern erfüllten Anforderungen. Das Subkategorisierungs-Prinzip ist ein weiteres Grammatik-Prinzip, das für alle Merkmalstrukturen gelten muss.

Grammatikregeln in HPSG

Obwohl HPSG eine Phrasenstruktur-Grammatiktheorie ist, gibt es keine 'echten' Phrasenstruktur-Regeln. Da die Phrasenstruktur innerhalb einer Merkmalstruktur über das DTRS-Merkmal beschrieben wird, sind Grammatikregeln Bedingungen über die Wohlgeformtheit von Merkmalstrukturen. Da die meisten Informationen im Lexikon spezifiert sind, braucht man nur sehr wenige, allgemeine Grammatikregeln. Da ausserdem die Reihenfolge-Bedingungen wie in GPSG separat behandelt werden, nennt man die Grammatikregeln auch 'ID-Schemata' (oder einfach Dominanz-Schemata). Ein Beispiel:

(alte Version des Head-Subject-Schemas)
_                                                   _ 
| SYNSEM | LOC | CAT | SUBCAT  < >                  |
|      _                                          _ |
| DTRS | HEAD-DTR | SYNSEM | LOC | CAT | LEX  -   | |
|      | COMP-DTRS <[ ]>                          | |
|      -                                          - |
-                                                   -

Diese Regel entspricht dem, was man üblicherweise beschreibt durch:

S  -> NP  VP
NP -> Det  N1
NP -> NP[Genitiv]  N1

Die Regel sagt, dass eine vollständige Phrase (eine Merkmalstruktur mit leerer SUBCAT-Liste), aus einem nicht-lexikalischen Head und einem einzelnen Komplement (<[ ]> = Liste mit genau einem Element) bestehen kann.

Ein zweites Beispiel:

(Head-Complement-Schema)
_                                                         _ 
| SYNSEM | LOC | CAT | SUBCAT  <[ ]>                      |
|                                      _                _ |
| DTRS | HEAD-DTR | SYNSEM | LOC | CAT | LEX  +         | |
|                                      | HEAD | INV  -  | |
|                                      -                - |
-                                                         -

Diese Regel entspricht u.a.:

VP  -> V  NP 
N1 ->  AdjP N

Die Regel sagt, dass eine Phrase, der noch genau ein Komplement fehlt (also z.B. VP oder N1), aus einem lexikalischen Head (und hier nicht weiter spezifizierten Komplementen) bestehen kann, wenn die HEAD-Tochter nicht invertiert ist.


Martin Volk <volk@ifi.unizh.ch>
Date of last modification:
URL dieser Seite: http://www.ifi.unizh.ch