11.3.  Formale Grammatiken

Kontextfreie Phrasenstruktur-Grammatiken 

Beispiel 11.3.1 (Kontextfreie Grammatik (CFG, context free grammar)).

Definition 11.3.2 (Kontextfreie Grammatik). Eine Kontextfreie Grammatik G = Φ,Σ,R,Sbesteht aus:

  1. Nichtterminalsymbolen Φ
  2. Terminalsymbolen Σ
  3. Regelmenge R Φ × Γ (mit Γ = Φ Σ)
  4. Startsymbol S Φ
Links vom Produktionspfeil hat es exakt 1 Nichtterminal.

11.3.1.  Ableitung

Beispiel-Evaluation
Siehe Abb. 11.2 auf Seite 464.


PIC PIC PIC PIC PIC PIC PIC PIC PIC

Abbildung 11.2: Beispiel für Linksderivation und Parsebaumkonstruktion

Formales Ableiten von Sätzen 

Definition 11.3.3 (Unmittelbare Ableitungsrelation). Die unmittelbare Ableitungsrelation ⇒ ⊆ Γ × Γ einer Grammatik ist die Menge aller Paare u,vmit u,v,w,z Γ, für die gilt:

Definition 11.3.4 (Ableitung (derivation)). Eine Ableitung ist ein n-Tupel w1,,wnvon Zeichenketten wi Γ mit (1 i n) , so dass gilt:

Normale Schreibweise für Ableitungen

w1 wn

Beispiel: Ableitung mit kontextfreier Grammatik 

S1NP2VP2EN3Egon9V4 NP4 sah5 D6 N6 den7 Pudel8





Ableitung u Regel v




u1wu2 w z u1zu2








S ϵ S ϵ S NP VP ϵ NP VP ϵ
NP VP ϵ NP VP NP EN ϵ EN VP
EN VP EN VP ϵ VP V NP EN V NP ϵ
EN V NP EN V NP V sah EN sah NP
EN sah NP EN sah NP ϵ NP D N EN sah D N ϵ
EN sah D N EN sah D N D den EN sah den N
EN sah den N EN sah den N ϵ N Pudel EN sah den Pudel ϵ
EN sah den Pudel ϵ EN sah den Pudel EN Egon ϵ Egon sah den Pudel
Egon sah den Pudel

Sätze und Sprachen 

Definition 11.3.5 (Ableitungsrelation (derivation relation)). Die Ableitungsrelation ∗⇒ ist die reflexiv-transitive Hülle von . Sie verbindet alle Folgen von Symbolen, welche unmittelbar oder mittelbar voneinander abgeleitet werden können.

Definition 11.3.6 (Satz). Eine Zeichenkette aus Terminalsymbolen a Σ ist ein Satz einer Grammatik G = Φ,Σ,R,S, gdw. er aus dem Startsymbol abgeleitet werden kann:

S ⇒∗ a

Definition 11.3.7 (Sprache einer Grammatik G). Die Sprache LG einer Grammatik G = Φ,Σ,R,Sist die Menge aller ihrer Sätze a Σ.

             ∗
LG  = { a | S ⇒ a }

11.3.2.  Grammatiktypen

Grammatik-Regeln, Sprachklassen und Automaten 
Die verschiedenen Grammatiktypen unterscheiden sich hinsichtlich der Bedingungen, die an die Regelmenge R gestellt werden. Es seien A,B Φ,w Σ und α,β,γ Σ).





Sprachklasse
Form der Grammatikregeln
Automatentyp








Regulär A w Endlicher Automat
(Typ 3) A wB oder A Bw




Kontextfrei A α Kellerautomat
(Typ 2)




Kontext- αAγ αβγ mit βϵ oder
sensitiv S ϵ (dann darf S nicht Linear
(Typ 1) auf einer rechten Seite beschränkter
einer Regel vorkommen) Automat (LBA)




(Typ 0) α β (mit αϵ und α ⁄∈ Σ) Turingmaschine




Die Komplexität der Berechnungen für das Parsen steigt mit jedem Grammatiktyp an.

Chomsky-Hierarchie [Hopcroft et al. 2002]


pict

Abbildung 11.3: Teilmengenbeziehungen der Sprachklassen von Chomsky




Sprachklasse Typ Beispiel






regulär 3 {an}
kontextfrei 2 {anbn}
kontextsensitiv 1 {anbncn}
allgemein 0



mit n 1

Echte Teilmengen

Für alle Typ–i–Sprachen gilt: L3 L2 L1 L0 .

Wo befinden sich natürliche Sprachen? [Hess 2005, 138ff.]

Mindestens Typ 2: NPnVPn (central embedding)

      -----------------------------------------------  
     |          ----------------------------         |  
     |         |            --------        |        |  
     |         |           |        |       |        |  
The man whose wife whose child is angry is sad is surprised

Mindestens Typ 1 nach [Shieber 1985, Kallmeyer 2005]: NPiNPjViVj (cross serial construction)

                              ------------------  
                             |                  |  
                        ------------------      |  
                       |     |            |     |  
                --------------------      |     |  
               |       |     |      |     |     |  
mer wänd   d’Chind am Hans s’Huus  laa  hälfe aaschtriiche

Komplexität, Grammatikalität, Akzeptanz von Sprache 
Es darf daher getrost, was auch von allen, deren Sinne, weil sie unter Sternen, die, wie der Dichter sagt, zu dörren, statt zu leuchten, geschaffen sind, geboren sind, vertrocknet sind, behauptet wird, enthauptet werden, dass hier einem sozumaßen und im Sinne der Zeit, dieselbe im Negativen als Hydra betrachtet, hydratherapeutischen Moment ersten Ranges, immer angesichts dessen, dass, wie oben, keine mit Rosenfingern den springenden Punkt ihrer schlechthin unvoreingenommenen Hoffnung auf eine, sagen wir, schwansinnige oder wesenzielle Erweiterung des natürlichen Stoffeides zusamt mit der Freiheit des Individuums vor dem Gesetz ihrer Volksseele zu verraten den Mut, was sage ich, die Verruchtheit haben wird, einem Moment, wie ihm in Handel, Wandel, Kunst und Wissenschaft allüberall dieselbe Erscheinung, dieselbe Tendenz den Arm bietet, und welches bei allem, ja vielleicht eben trotz allem, als ein mehr oder minder undulationsfähiger Ausdruck einer ganz bestimmten und im weitesten Verfolge excösen Weltauffasseraumwortkindundkunstanschauung kaum mehr zu unterschlagen versucht werden zu wollen vermag - gegenübergestanden und beigewohnt werden zu dürfen gelten lassen zu müssen sein möchte.

Christian Morgenstern, Vorrede zu Galgenliedern