1.1. Infos
1.1.1. Unterlagen
Kurs-Leitseite im WWW und Lehrmaterialien
OLAT-Kurs
namens “CL_10_FS_Finite-State Methoden in der Sprachtechnologie”
Kursbücher
- K. R. Beesley und L. Karttunen (2003): Finite State Morphology, CSLI Publications. ISBN:
1-57586-434-7 http://www.stanford.edu/~laurik/fsmbook/home.html (Buch enthält
auch Software, welche für Übungen intensiv benutzt wird). Ev. antiquarisch von
Mitstudierenden erhältlich.
- Carstensen et al. (2009): Computerlinguistik und Sprachtechnologie: Eine Einführung.
2009.
1.1.2. Inhalt
Konzept und Inhalt der Vorlesung
Die VL “Finite-State-Methoden in der Sprachtechnologie” vermittelt
- die formalen Grundlagen
der Endlichen-Automaten-Technik (EAT) (engl. Finite State Methods (FSM)).
- den praktischen Einsatz
der Xerox Finite State Tools (XFST
), um die wichtigsten Anwendungen der FSM in der Sprachtechnologie programmieren zu
können: morphologische Analyse und Generierung, Tokenisierung, Spelling Correction, Named
Entity Recognition, Chunking, flache syntaktische Analyse
- die grundlegende Theorie
zur Beschreibung von morphologischen Erscheinungen in verschiedenen natürlichen
Sprachen.
1.1.3. Lernform
Projektorientierte Vorlesung
- Ziel: Selbständige Durchführung eines kleinen Schluss-Projekts
mit Finite-State-Methoden aus dem Bereich: Morphologiesystem für Französisch (basierend auf
Lexikon „morphalou“) oder für Rätoromanisch entwickeln, Erkennung von geographischen
Bezeichnungen in Jahrbüchern vom SAC, Spelling-Correction für Deutsch von rohem OCR aus
Jahrbüchern vom SAC vor 1911, …oder eigene Ideen!
- Lehrform: Theoretische Inputstunden (ca. 10 Termine; normalerweise 14-15.45h im BIN-1-D-7)
mit anschliessendem praktischen Arbeiten im Computerraum (normalerweise 16-17.30h im
BIN-0-B-4) mit persönlicher Betreuung!
- Übungsstunde: Teilpräsenz ist obligatorisch für Besprechung der Übungen, sowie Planung und
Besprechungen für das Schlussprojekt
- Aufwand für Vorlesung: 4 ECTS-Punkte, d.h. 120h Arbeit
1.1.4. Leistungsnachweis
Schriftliche Übungen (SU), Schluss-Projekt und schriftliche Prüfung
- 5 Übungseinheiten
zur Abgabe ab Woche 3
- Pflicht für Bachelor- und Informatik-Studierende: 25% der Schlussnote
- Wärmstens empfohlen für Liz-Studierende!
- Benotung (in 1/10-Schritten): 6 (4-5 SU); 4.6 (3 SU); 3.3 (2 SU); 2 (1 SU); 1 (0 SU)
- Bestanden/Nicht-Bestanden-System pro SU
- Teilweise Musterlösungen, aber auch Fragen und Diskussion in der Übungsstunde
- Schluss-Projekt
: 25% der Schlussnote
- Schriftliche Schlussprüfung
: 50% der Schlussnote
Schriftliche Prüfung
- Zeit: Montag, 7.6.2009 ab 14h
- Geplante Form: 30 Minuten Theorie plus praktischer Teil an Computer
- Stoff: Skript, Übungen, Pflichtlektüre
- Bitte das für Sie gültige Infoblatt (Bachelor vs. Lizentiat) genau lesen! [ICL 2007a, ICL
2007b]