Merkmalstrukturen

[ Weiter ] [ Seitenende ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]

12.1
Merkmalstrukturen

12.1.1
Motivation

Merkmalsanalysen

Wissenschaftshistorische Motivation

Die Verwendung von (binären) Merkmalen in der modernen linguistischen Theorie geht zurück auf die Theorie der strukturalistischen Phonologie, wo die Analyse mit sogenannten «Distinktiven Merkmalen» zentral war.

Beispiel 12.1.1 (Merkmalsanalyse in der Phonologie).
Das Phonem /b/ = [+Verschlusslaut, +Bilabial, +Stimmhaft].

Beispiel 12.1.2 (Merkmalsanalyse in der Semantik nach Bierwisch).
Die Verwandschaftsbezeichnung «Cousin» [+Mensch, +verwandt, –direkt verwandt, +gleiche Generation, +männlich, –weiblich ].

Beispiel 12.1.3 (Merkmalsanalyse in der Syntax nach Chomsky).
Die Hauptwortarten Nomen, Verben, Adjektive und Präpositionen «A» [+Verbal,+Nominal] oder «P» [–Verbal,–Nominal].

Informationsorientierte Motivation

Zur Bedeutung von Merkmalstrukturen

Merkmalstrukturen beschreiben Mengen von Objekten , welche bestimmte Bedingungen (constraints) erfüllen, die als Merkmal-Wert-Paare formuliert sind.

⌊ ⌋
| Wortart verb|
|⌈ Numerus sg |⌉
Person 3

{ x | wortart(x) = verb∧ numerus (x) = sg ∧ person(x) = 3 }

∧ steht für logisches UND.

Unterspeziﬁkation

Je weniger Merkmal-Wert-Paare in einer Merkmalstruktur speziﬁziert sind,

desto weniger Information ist vorhanden.
desto mehr Objekte können die Bedingungen erfüllen.

Merkmalstrukturen in der Syntax
Wie kann die mehrdeutige Information aus dem Lexikon und der Syntaxanalyse widerspruchsfrei vereinigt werden zur Informationsstruktur des Satzes „Hans schwamm“?

Hans: [Lemma:’Hans’, Case:Nom, Pers:3, Num:Sg] oder [Form:’Hans’, Case:Acc, Pers:3, Num:Sg] oder [Form:’Hans’, Case:Dat, Pers:3, Num:Sg]
schwamm: [Lemma:’schwimmen’, Tense:Past, Pers:1, Mood:Ind] oder [Form:’schwamm’, Tense:Past, Pers:3, Mood:Ind]

Beispiel 12.1.4 (Merkmalstruktur des Satzes „Hans schwamm“).

⌊ ⌋
Subj [Lemma: ’Hans ’, Case:Nom, Pers:3, Num:Sg ]
|| Pred [Lemma: ’schwimmen ’, Tense:Past, Pers:3, Mood:Ind ]||
⌈ ⌉
Clause Decl

Einfache Merkmalstrukturen

Mengentheoretische Beschreibung

Eine einfache, d.h. nicht-rekursive Merkmalstruktur ist eine Abbildung M : A → V von einer endlichen Menge von Attributen A auf Werte V .

Beispiel 12.1.5 (Einfache linguistische Merkmalstrukturen).
[num pl]

pers 1 M = {⟨num,pl⟩,⟨pers,1⟩}

Datenstrukturen in Programmiersprachen

Dies entspricht Hashes (PERL), Dictionaries (PYTHON), Records (PASCAL), Listen von Merkmal-Wert-Paaren (PROLOG, LISP) oder Eigenschaften von Objekten (JAVA).

12.1.2
Rekursiv

Beispiel: Gegenseitig rekursiv deﬁnierte Mengen

Gerade Zahlen

0 ist eine gerade Zahl.
Wenn x eine ungerade Zahl ist, dann ist der Nachfolger von x eine gerade Zahl.

Ungerade Zahlen

Wenn x eine gerade Zahl ist, dann ist der Nachfolger von x eine ungerade Zahl.

Sätze und NP

Da Sätze Nominalphrasen enthalten und Nominalphrasen wiederum (Relativ-)Sätze enthalten können, müssen diese Kategorien auch gegenseitig rekursiv deﬁniert werden.

Merkmalstrukturen gegenseitig rekursiv deﬁniert

Deﬁnition 12.1.6 (Attribut-Wert-Struktur, attribute value matrix (AVM)). Die Menge der Merkmalstrukturen aus einer Menge A von Merkmalen (Attributen) und V von atomaren Werten lässt sich rekursiv angeben.

Merkmalstrukturen

Die leere Menge ∅ ist eine Merkmalstruktur.
- Diese “leere” Merkmalstruktur wird meist notiert als [].
Wenn M eine Merkmalstruktur , a ∈ A ein Merkmal sowie w ein Wert ist, dann ist M₁ = M ∪{⟨a,w⟩} eine Merkmalstruktur,
- Vorausgesetzt: M enthält kein Paar ⟨a,u⟩ mit u ⁄= w.

Werte

Alle atomaren Werte v ∈ V sind Werte.
Wenn M eine Merkmalstruktur ist, dann ist M auch ein Wert.

Beispiel: Rekursive Konstruktion einer Merkmalstruktur M

Sei V = {sg,pl,1,2,3} und A = {AGR,NUM,PER}

Schritt	als Menge	in Matrix-Notation
1	M₁ = ∅	M₁ =
2	M₂ = M₁ ∪{⟨PER,3⟩}	M₂ =
3	M₃ = M₂ ∪{⟨NUM,sg⟩}	M₃ =
4	M = M₁ ∪{⟨AGR,M₃⟩}	M =

12.1.3
Als Graphen

Gerichtete Graphen

Deﬁnition 12.1.7 (directed graph, digraph). Ein gerichteter Graph G = ⟨N,E⟩ besteht aus einer endlichen, nicht-leeren Menge N von Knoten (nodes) und einer Menge E von Kanten (edges): E ⊆ N × N.

pict
G = ⟨{a,b,c,d},
{⟨a,b⟩,⟨b,c⟩,⟨b,d⟩,
⟨c,a⟩,⟨d,a⟩,⟨d,c⟩}⟩

Deﬁnition 12.1.8 (Verbindungen und Pfade). Ein Pfad ist eine endliche Folge von Knoten, welche paarweise durch Kanten verbunden sind. Z.B. ⟨d,c,a,b⟩.

Die Knoten n₁ und n₂ sind verbunden im Graphen G = ⟨N,E⟩, gdw. ⟨n₁,n₂⟩∈ E.

n₁ heisst Vorgänger von n₂. n₂ heisst Nachfolger von n₁.

Zyklen

Deﬁnition 12.1.9 (Einfacher Pfad). Ein einfacher Pfad ist ein Pfad, der einen Knoten höchstens einmal enthält.

Deﬁnition 12.1.10 (Zyklus). Ein Zyklus ist ein einfacher Pfad, an dessen Ende nochmals sein Anfangselement angefügt wird.

Zyklen der Form ⟨n,n⟩ heissen auch Schlaufen (loop).

Deﬁnitionsabhängig werden Schlaufen manchmal nicht als Zyklen aufgefasst.

Deﬁnition 12.1.11 (Zyklenfrei). Ein Graph, der keine Zyklen enthält, heisst zyklenfrei .

Bäume

Deﬁnition 12.1.12 (Gerichteter Baum). Ein Baum ist ein zyklenfreier, gerichteter Graph mit den Eigenschaften:

Es gibt genau einen Knoten n, der selbst keinen Vorgänger hat. Dieser Knoten heisst Wurzel .
Jeder Knoten ausser der Wurzel hat genau einen Vorgänger .
Von der Wurzel aus existiert ein Pfad zu jedem andern Knoten .

Deﬁnition 12.1.13 (Matrilineare Sprechweisen). Zwei Knoten sind Schwestern (Geschwister), wenn sie denselben Vorgänger (Mutter ) haben.

S
|
NP VP|
NE V| NP
Egon sah D N
| |
den Pudel

Markierte gerichtete Bäume

Deﬁnition 12.1.14 (markierter gerichteter Baum). Ein markierter gerichteter Baum ist ein gerichteter Baum T = ⟨N,E⟩. Er besitzt eine Markierungsfunktion für Kanten m_E : E → A, welche jeder Kante eine Markierung aus A zuordnet. Sowie eine Markierungsfunktion für Knoten m_N : N → B, welche jedem Knoten eine Markierung aus B zuordnet.

Deﬁnition 12.1.15 (Blatt). Die Blätter eines Baumes sind alle seine Knoten ohne Nachfolger.

Deﬁnition 12.1.16 (Innere Knoten). Die inneren Knoten eines Baumes sind alle Knoten mit mindestens einem Nachfolger.

Merkmalstruktur als markierter gerichteter Baum

Beispiel 12.1.17.
T = ⟨N,E⟩
N = {n₁,n₂,n₃,n₄}
E = {⟨n₁,n₂⟩,⟨n₂,n₃⟩,⟨n₂,n₄⟩}
m_E = {⟨⟨n₁,n₂⟩,AGR⟩,⟨⟨n₂,n₃⟩,PERS⟩,⟨⟨n₂,n₄⟩,NUM⟩} m_N = {⟨n₁,′′⟩,⟨n₂,′′⟩,⟨n₃,3⟩,⟨n₄,sg⟩}

pict

Abbildung 12.1:

Merkmalstruktur als gerichteter Baum

pict

Abbildung 12.2:

Kästchennotation

Merkmalstrukturen und Bäume

Deﬁnition 12.1.18 (Baum einer koreferenzfreien Merkmalstruktur). Ein markierter gerichteter Baum T stellt eine Merkmalstruktur M dar, gdw. er folgende Eigenschaften erfüllt:

Alle atomaren Werte und leeren Merkmalstrukturen von M sind die Blätter von T.
Die komplexen Werte in M sind die inneren Knoten von T.
Alle atomaren Werte bekommen in T als Knoten-Markierung ihren atomaren Wert.
Ein Merkmalwertpaar ⟨a,v⟩∈ M ergibt eine mit a beschriftete Kante vom Knoten M nach v.

[ Weiter ] [ Seitenbeginn ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]

12.1 Merkmalstrukturen

12.1.1 Motivation

12.1.2 Rekursiv

12.1.3 Als Graphen

12.1
Merkmalstrukturen

12.1.1
Motivation

12.1.2
Rekursiv

12.1.3
Als Graphen