3.1
Motivation
Langfristige FSM-Kursziele
Verständnis für
- reguläre (auch rationale) Sprachen und Relationen (Paar von Sprachen)
- endliche Netzwerke (endliche Automaten und Transduktoren)
- mathematische Operationen über Sprachen bzw. Netzwerken
- die Beziehung zwischen Sprachen/Relationen, Netzwerken und regulären Ausdrücken
Fähigkeiten
- Netzwerke mit xfst-Technologie zu programmieren, welche nicht-triviale
NLP-Applikationen ermöglichen
- Methodenkompetenz: Was ist einfach, möglich, schwierig mit FSM?
Warum Finite-State-Methoden verwenden?
Finite-State-Systeme sind
- mathematische elegant, flexibel und leicht modifizierbar.
- effizient (Rechenzeit) und kompakt (Speicherverbrauch) für typische NLP-Tasks.
- inhärent bidirektional. D.h. sie können analysieren und generieren.
- sprachunabhängig geeignet für „lower-level“-NLP: Tokenisierung, Rechtschreibekorrektur,
Phonologie, Morphologie, Tagging, NER, Chunking, flache Syntaxanalyse
Quelle:
B04
Warum Finite-State-Methoden verwenden?
- Deklarative Programmierung: Wir beschreiben die Fakten von natürlicher Sprache wie
Linguisten und schreiben keine Prozeduren.
- Der Anwendungskode ist in Laufzeitapplikationen (oder API-Aufrufen) gekapselt und
absolut sprachunabhängig.
„Finite-State Mindset“ entwickeln
Das Lernen der Notationen, der FSM-typischen Dekompositionen der Probleme, der typischen
Programmieridiome und -tricks braucht etwas Zeit und Übung.