14.2.  Lexiko-syntaktische Patterns

14.2.1.  Alshawi (1987): Wörterbuch-Aufbereitung

Extraktion lexikalischer Relationen aus einem Wörterbuch

Projekt-Idee

[ALSHAWI 1987] extrahiert lexikalische Information aus einem maschinenlesbaren Wörterbuch (MRD = machine readable dictionary): dem “Longman Dictionary of Contemporary English” (LDOCE).

Motivationen

Beispiel: Nomen “Barkasse”


pict


Aufgabe der Analyse

Implementation

Mini-Evaluation

Beispiel: Regeln für Relativsätze


pict

Abbildung 14.1: Regelapparat für Sätze wie “mug: a foolish person who is easily deceived”

14.2.2.  Hearst (1992)

Pattern-Ansatz von [HEARST 1992]

Motivation und Hauptziele

Nachteile

Die Methode scheint besonders gut für Hyponymie zu funktionieren – andere Relationen sind schwierig.

Hyponym-Pattern

Text aus Grolier’s American Academic Encyclopedia

The bow lute, such as the Bambara ndang, is plucked and has an individual curved neck.

Idee

Auch wenn man “Bambara ndang” noch nie gehört hat, weiss man, dass es eine Art “bow lute” sein muss.

Lexikalisch-syntaktisches Muster

Aus

N P0  such as  N P1,N P2,...,(and | or)N Pn
folgt (vermutlich), das alle NP1..n Hyponyme von NP0 sind.

hyponym("Bambara ndang","bow lute")

Weitere Muster

Problem der Modifikation

In einem Zeitungstext (New York Times) mit ca. 20 Millionen Wörtern finden sich etwa 3178 Sätze mit dem “such-as”-Muster. Aber nur 46 Relationen lassen sich damit identifizieren, wenn man keine modifizierten Nomen erlaubt.