8.3
 Chunk Parsing

Partielle syntaktische Analyse 

Definition 8.3.1. Eine partielle syntaktische Analyse (flache Analyse, engl. shallow parsing) berechnet für einen Satz keine vollständige Analyse bezüglich Konstituenz und Dependenz. Gewisse Teilstrukturen bleiben nebengeordnet und in ihrer syntaktischen Funktion unbestimmt .


pict

Abbildung 8.6: Partielle Analyse von einem Chunk-Tagger (TreeTagger) von H. Schmid

Chunking-Regeln schreiben in Pfeilnotation 


pict

Abbildung 8.7: Partielle Analyse von einem Chunk-Tagger (TreeTagger) von H. Schmid

Wie kann man die zulässigen Chunks beschreiben?

NC -> ART NN

8.3.1
 Abneys Chunk-Definition

Chunks (Teilstrukturen) nach [Abney 1991]

Beispiel 8.3.2 (Chunks nach Abney).
[I begin] [with an intuition]: [when I read] [a sentence], [I read it] [a chunk] [at a time].

Motivationen

8.3.2
 IOB-Chunk

Flache Chunks im IOB-Format 

Definition 8.3.3 (IOB-Chunks). IOB-Chunks beschreiben eine flache syntaktische Schicht über die getaggten Wortformen, welche in Form von Chunk-Tags auf die Token abbildbar ist.


 We PRP B-NP
 saw VBD 0
 the DT B-NP
 yellow JJ I-NP
 dog NN I-NP

pict
PIC

8.3.3
 Verschachtelte Chunks

Verschachtelte Chunks 

Definition 8.3.4 (Verschachtelte Chunks). Verschachtelte Chunks beschreiben eine syntaktische Struktur von begrenzter Tiefe. Rekursive Verschachtelung, z.B. ein Nominal-Chunk innerhalb eines Nominal-Chunks, ist normalerweise nicht möglich.

Beispiel 8.3.5 (Chunk Parsing Output mit Verschachtelungstiefe 3).


[PX [APPR für]
    [NX [ARTIND eine]
        [AJXatt [ADJA gewisse]]
        [NN Reibungslosigkeit]]]

Hinweis zur Chunk-Benennung

Chunks werden manchmal wie Phrasen (NP) notiert, gebräuchlich sind auch NX oder NC.