Programmierprojekt "Erkennung von Teilsatzgrenzen"
BearbeiterIn: N.N.
Betreuer: Martin Volk/ Simon Clematide
Einführung
Beim Parsen ist die korrekte Erkennung der Grenzen von Teilsätzen (Clause Boundary Detection) von grosser Nützlichkeit. Es gibt einen von Martin Volk entwickelten Prototypen (in Perl).
Ziel und Zweck
- Es soll ausgehend vom bestehenden Prototypen ein heuristisches Modul programmiert und evaluiert werden.
Arbeitsschritte
Festzulegen sind:
- Schwerpunkt auf Clause-Grenzen-Erkenner oder Clause-Erkenner ??
- Schwerpunkt auf Evaluierung oder Verbesserung der Implementierung ??
- Können die Clause-Grenzen-Regeln auch gelernt werden (z.B. analog zum Brill-Verfahren)??
Anforderung
Perl- oder Prolog-Kenntnisse
Benötigte Ressourcen
Literatur und Links
Eva Ejerhed: Finite state segmentation of discourse into clauses. In: A. Kornai (ed): ECAI Workshop: Extended Finite State Models of Language. 1996.
Simon Clematide