3.3. Computermorphologie
3.3.1. Typische Berechnungen
Typische Berechnungen in der Computermorphologie
- Ist die Zeichenkette x eine Wortform der Sprache L?
- Welche Wortarten können der Wortform x zugewiesen werden?
- Welche morphosyntaktischen Merkmale drückt die Wortform x aus?
- Welche Lemmata liegen der Wortform x zugrunde?
- Welche Wortformen realisieren das Lemma l mit den morphologischen Merkmalen m1 bis
mn?
- Aus welchen morphologischen Bestandteilen besteht eine Wortform x?
- Wie sieht die morphologische Konstituentenstruktur einer Wortform x aus?
- …
Frage
Wie heissen die Fachbegriffe für die obigen Berechnungen?
Beispiel: Grammatik-Korrektur in Microsoft Word 2004
Siehe Abb. 3.5 auf Seite 105. Welches linguistische Wissen wird hier eingesetzt?
3.3.2. Anwendungen
Anwendungen der Computermorphologie
- Grammatikkorrektur
: Sind morphosyntaktische Kongruenzen innerhalb einer NP erfüllt?
- Silbentrennung
: Wie trennt man “erklecklich”?
- Text-To-Speech
-Systeme (Graphem-zu-Phonem-Konversion): Wie spricht man “th” in “hothouse”
aus?
- Rechtschreibe-Korrektur
: Wie unterscheidet man zwischen falsch geschriebenen und dem Korrektursystem unbekannten
Wörtern?
- Tokenisierung
: Wie erkennt man in Schriftsystemen wie dem Chinesischen die lexikalischen Einheiten
(Wörter), welche aus einem oder mehreren Graphemen (Silbenschrift) zusammengesetzt
sind?
- Information Retrieval,Text Mining
: Wie kann in morphologisch reichen Sprachen die Grundform von Wörtern zur Indexierung
berechnet werden?
- Information Extraction
: Wie kann ich die flektierten Formen eines Lemmas finden?
- Parsen
: Welche morphosyntaktischen Merkmale kann eine flektierte Wortform realisieren? Wie finde ich
Valenz- oder semantische Information in einem lemma-basierten Lexikon?
- Generierung
: Welche flektierte Wortform drückt die verlangten morphosyntaktischen Merkmale
aus?