[ Weiter ] [ Zurück ] [ Zurück (Seitenende) ] [ Seitenende ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]
Kookkurrenz (Miteinandervorkommen)
Zwei Wortformen kommen miteinander in einer Texteinheit vor.
Typische Texteinheiten für Kookkurrenzanalysen
Wie zufällig ist Sprache?
Wenn alle Wörter unabhängig voneinander per Zufall geäussert werden würden, hätten Kookkurrenzen die Wahrscheinlichkeit von unabhängigen Ereignissen: p(w1w2) = p(w1) × p(w2)
Effektiv kommen viele Kookkurrenzen viel zu häufig vor, um als unabhängige Ereignisse gelten zu können.
Statistische Kollokationsmasse
Kollokation als statistisch signifikante Kookkurrenz
“if two words are involved in a collocation then the words must appear together significantly more often than expected by chance.” [SMADJA 1993]
Typische Probleme für statistische Ansätze
Kollokationen von Wortformen mit Signifikanz
|
Signifikante Kollokationen nach [HEYER et al. 2001]
Die Signifikanz der Kollokation eines Worts A zum Wort B, kurz sig(A,B) ergibt sich
aus
Einschränkung
Diese Formel dient als effiziente Annäherung, sofern 2x > k. [LäUTER 2002]
Eigenschaften des Signifikanzmasses
Homogenisierung von Kollokationsmengen
Problem
Kollokationen mit hoher Signifikanz sind (semantisch) heterogen.
Ideen
Definition 14.3.1 (Kollokation höherer Stufen). Anstelle der Vorkommen in Sätzen wird das Vorkommen in signifikanten Kollokationen dieser Sätze gezählt. Im Allgemeinen bauen Kollokationen n-ter Stufe auf Kollokationsmengen der Stufe n − 1 auf.
Anreicherung (augmentation) von Kohyponymen
Algorithmus nach [BIEMANN et al. 2004b]
Beispiel 14.3.2 (Kohyponym-Kandidaten aus Kollokationsmengen 3. Stufe [BIEMANN et al. 2004a]).
Definition 14.3.3 (Ähnlichkeit von Kollokationsmengen). Die Ähnlichkeit der Kollokationsmengen der beiden Wortformen A und B wird berechnet, indem der Anteil der gemeinsamen Wortformen gezählt wird, welcher sich in den Satzkollokationen von jedem Element der Kollokationsmenge von A bzw. B befindet.
Kombination von Signifikanz und Ähnlichkeit
[ Weiter ] [ Zurück ] [ Zurück (Seitenende) ] [ Seitenbeginn ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]