13.2
 Unifikationsgrammatik

Unifikationsgrammatik 

Definition 13.2.1 (Unifikationsgrammatik nach [Bussmann 2002]). Unifikationsgrammatik (unification grammar) ist ein „Grammatikmodell, das auf einer Weiterentwicklung des linguistischen Merkmals basiert. Jede linguistische Einheit (Wort oder Phrase) ist durch eine Merkmalstruktur gekennzeichnet.“

Verhältnis Phrasenstruktur vs. Merkmalstruktur

13.2.1
 Formalismen

PATR-II [Shieber 1992]

Definition 13.2.2 (PArsing and TRanslation). Der PATR-II-Formalismus ist ein Grammatik-Formalismus mit hoher Theorieneutralität (Werkzeugformalismus).

Komponenten von PATR-II

Regeln in PATR-II Notation 

Lexikonregel (partiell)

X takes
XCAT= V
XNUM= SG
XPERS= 3
XTENSE= PRES

X  ⌊CAT     V    ⌋
   |             |
   ||NUM     SG   ||
   |⌈PERS    3    |⌉
    TENSE   PRES
         |

       takes

Syntaxregel mit Numerus

X0 X1 X2
X0CAT= NP
X1CAT= D
X2CAT= N
X0NUM= X1NUM
X0NUM= X2NUM
            ⌊          ⌋
        X0  ⌈CAT    NP ⌉
             NUM    -1|

    ⌊        ⌋        ⌊         ⌋
X1  ⌈CAT    D⌉    X2  ⌈CAT     N⌉
     NUM    1-         NUM     1-

XLE-Formalismus 
Der XLE-Formalismus unterstützt die Grammatikmodellierung in der Tradition der LFG (Theorieformalismus). LFG enthält 2 verschiedene Repräsentationsebenen:

Relativ theorieunabhängige Komponenten von XLE

Etwas gewöhnungbedürftige Notation für Referenz auf Merkmalstrukturen von Mutterknoten (LFG:; XLE:^) und Tochterknoten (LFG:; XLE:!).

Regeln in XLE-Notation 

Lexikonregel (partiell)

takes V * (^NUM)=SG  
          (^PERS)=3  
          (^TENSE)=PRES.  

V  ⌊NUM     SG   ⌋
   |             |
   |⌈PERS    3    |⌉
    TENSE   PRES
         |
       takes

Syntaxregel mit Numerus

NP --> D: (^NUM)=(!NUM);  
       N: (^NUM)=(!NUM);  
       .

             [        ]
        N P   NUM    1-

   [       |]        [       |-]
D   NUM    1-     N   NUM    -1

13.2.2
 Kongruenz

Übereinstimmung von Merkmalen 

Definition 13.2.3 (Kongruenz, engl. Agreement). Kongruenz : Übereinstimmung zwischen zwei oder mehreren Satzelementen hinsichtlich ihrer morpho-syntaktischen Kategorien (Kasus, Person, Numerus, Genus). [Bussmann 2002]

Kongruenz in Grammatikformalismen

Kongruenz lässt sich in Unifikationsgrammatiken durch Pfadgleichungen ausdrücken.

Phänomene der Numerus-Kongruenz im Englischen 
Kongruenzen in Numerus

Frage

Wie lauten die Merkmalsgleichungen in den Grammatikregeln?

Kongruenz II 
Kongruenzphänomene mit weiteren Kategorien

13.2.3
 Rektion

Rektion bzw. Valenz 

Definition 13.2.4 (Rektion, government). Rektion : Lexemspezifische Eigenschaft von Verben, Adjektiven, Präpositionen oder Substantiven, die die morphologische Kategorie (insbesondere den Kasus) abhängiger Elemente bestimmt. Rektion kann unter Valenz subsumiert werden, insofern Valenzträger die morphologische Form der von ihnen ’regierten’ (abhängigen) Elemente bestimmen (’regieren’). [Bussmann 2002]

Definition 13.2.5 (Valenz, Subkategorisierung). Valenz ist die Fähigkeit eines Lexems, seine syntaktische Umgebung vorzustrukturieren, in dem es anderen Konstituenten im Satz Bedingungen bezüglich ihrer grammatischen Eigenschaften auferlegt. [Bussmann 2002]
Verben gleicher Valenz werden oft in Subkategorien aufgeteilt.

Frage

Wie lässt sich Rektion in Unifikationsgrammatiken ausdrücken? Rektion/Valenz wird durch Merkmalspezifikation ausgedrückt.

Rektion und Valenz 

Lexikalisierung

Viel Rektions-Information stammt aus den Lexikoneinträgen.

"likes ist eine finite Verbform und transitiv"  
likes V * (^SUBCAT)=TRANS (^VFORM)=FIN .

Aus Gründen der Übersichtlichkeit sind nicht alle morphosyntaktischen Merkmale aufgeführt.

Minigrammatik in XLE mit minimalen Merkmalen 

PSG ENGLISH RULES (1.0)  
   S --> NP: (!CASE)=NOM  
             (^V NUM)=(!NUM);  
         VP: (^V NUM)=(!NUM).  
 
   NP --> { D: (^NUM)=(!NUM);  
            N: (^NUM)=(!NUM);  
          | PN: (^NUM)=(!NUM)  
                (^CASE)=(!CASE);  
          } .  
 
   VP --> V: (^NUM)=(!NUM)  
             (^V SUBCAT)=(!SUBCAT);  
          { NP: (!CASE)=ACC  
                (^V SUBCAT)=TRANS;  
          "e = epsilon"  
          | e: (^V SUBCAT)=INTRANS  
          }  
          .

PSG ENGLISH LEXICON (1.0)  
bark      V * (^SUBCAT)=INTRANS  
              (^NUM)=PL.  
barks     V * (^SUBCAT)=INTRANS  
              (^NUM)=SG.  
 
like      V * (^SUBCAT)=TRANS  
              (^NUM)=PL.  
likes     V * (^SUBCAT)=TRANS  
              (^NUM)=SG.  
 
the       D * . "Unterspezifikation"  
two       D * (^NUM)=PL.  
 
he        PN * (^CASE)=NOM (^NUM)=SG.  
him       PN * (^CASE)=ACC (^NUM)=SG.  
 
dog       N *  (^NUM)=SG.  
dogs      N *  (^NUM)=PL.  

Diskussion der Umsetzung in XLE 
Aufgrund der Phrasenstruktur zulässige, aber inkorrekte Sätze werden ausgefiltert.

Probleme

Ziel einer vollständigen F-Struktur-Repräsentation

13.2.4
 Syntaktische Funktionen

Köpfe und ihre Projektionen 

Kopfprinzip

Nicht-Köpfe 

Funktionalisierung von Nicht-Köpfen

Tochterkonstituenten, welche nicht Köpfe ihrer Mutter sind, werden in ihrer Funktion bezüglich dem Kopf bestimmt und als Unterstruktur integriert.

Typische Funktionen in der LFG

Demo von syntaktischen Funktionen in LFG: http://decentius.aksis.uib.no/logon/xle.xml Die Frage, was ist der Kopf, ist nicht immer einfach zu beantworten. Beispiele?

Minigrammatik in XLE mit minimalen Merkmalen 

PSG ENGLISH RULES (1.0)  
   S --> NP: (^SUBJECT)=!  (!CASE)=NOM ;  
         VP: ^=!  (^SUBJECT NUM)=(!NUM).  
 
   NP --> { D: (^SPEC)=! ;  
            N: ^=!  (^SPEC NUM)=(!NUM) ;  
          | PN: ^=! ;  
          } .  
 
   VP --> V: ^=! ;  
          { NP: (^OBJECT)=!  (!CASE)=ACC  (^SUBCAT)=TRANS ;  
          | e: (^SUBCAT)=INTRANS  
          }  
          .

Die Köpfe sind erkennbar an ^=!. Die Nicht-Köpfe sind erkennbar an (^FUN)=!.

Mengenwertige Merkmale 
XLE (und andere Unifikationsgrammatiken) erlauben oft zusätzliche Mechanismen und Strukturen, welche über reine Unifikation hinausgehen.

Beispiel 13.2.6 (F-Struktur von wiederholten Kategorien).
Wie kann man die Struktur von iterierten Kategorien auf der F-Struktur repräsentieren?

NP --> D  
       ADJ* : ! $ (^ADJUNCT)} ;  
       N .

Der Operator F1 $ F2  besagt: Die F-Struktur F1 ist Element in der mengenwertigen F-Struktur F2. (LFG-Notation: F1 F2)

Das Schema gilt also für jede der wiederholbaren ADJ-Knoten.