[ Weiter ] [ Zurück ] [ Zurück (Seitenende) ] [ Seitenende ] [ Überkapitel ]
Aufstarten des NLTK ChunkParsers
NLTK-NP-Chunkparser
Einfache Entwicklungsumgebung, um Chunk-Grammatiken zu schreiben und zu evaluieren anhand von NP-Chunks aus der CONLL-Shared-Task. http://www.cnts.ua.ac.be/conll20001
Aufstarten
Chunking-Regeln schreiben für NLTK-NP-ChunkParser
Wie kann man die zulässigen NP Chunks beschreiben?
{<NN> <NN> <NNS>}
Chunks werden nur auf der Ebene der Wortarten (PoS-Tags) der Wörter spezifiziert (deshalb heissen sie Tag-Patterns).
Mehrere Tag-Patterns nacheinander anwenden
Reguläre Muster für Tag-Patterns
Übliche Matching-Strategien
Chunk-Gruppierung nur in bestimmten Kontexten
Die Anwendung einer Gruppierung lässt sich auf bestimmte Kontext einschränken. Links und/oder rechts von den geschweiften Klammern können Tag-Patterns stehen.
Idee
Manchmal ist es einfacher zu sagen, was nicht im Chunk sein soll, nämlich die Chinks.
Reguläre Ausdrücke innerhalb einer Tag-Angabe
Achtung: Zeichen mit Sonderbedeutung in regulären Ausdrücken müssen geschützt werden, um für das normale Zeichen zu stehen: z.B. <PRP\$>
[ Weiter ] [ Zurück ] [ Zurück (Seitenende) ] [ Seitenbeginn ] [ Überkapitel ]