Einführungsvorlesung

Computergestützte Textanalyse
Methoden und Werkzeuge


Prof. Dr. Martin Volk

Institut für Computerlinguistik


Di 16:15-18:00

KO2-F-180


Einstieg auch nach der ersten Semesterwoche noch möglich.



Dies ist zweifellos die beste einführende Lehrveranstaltung, um zu erfahren, wie man den Computer einsetzen kann, um Sprachmaterial zu analysieren.



Die drei Schwerpunkte der Vorlesung sind:


  1. Einführung in die grundlegenden Methoden der Analyse von Textsammlungen (Korpora) mit Hilfe von Computern (v.a. anhand deutsch-, englisch-, französisch- und schwedischsprachiger Texte).

  2. Übersicht über frei verfügbare und kommerzielle Software-Pakete.

  3. Erste Schritte zur eigenen Textanalyse.




Fragestellungen und Lösungsansätze:


  1. Welche Nachbarn hat das Wort „Bildung“ in meinem Korpus?

    Konkordanzen und Redensarten

  2. Wieso kann mein Programm dieses Korpus nicht verarbeiten?

    Korpusformate und Konvertierungswerkzeuge

  3. Wie viele Verben gibt es in meinem Text?

    Wortartenerkennung und Häufigkeiten

  4. Welche Grammatikfehler findet mein Computer?

    Grammatikprüfprogramme und Grammatiken

  5. Wie kann ich in meinem englischsprachigen Korpus die Relativsätze ohne Relativpronomen finden?

    Parser und Treebanks

  6. Wie kann ich meinen Text auf die Hälfte kürzen?

    Indexieren und Automatisches Zusammenfassen

  7. Wann wird „Bildung“ auf Französisch mit „éducation“ und wann mit „formation“ übersetzt?

    Mehrsprachige Korpora und Alignierung


  1. Kann der Computer meinen Text ins Englische übersetzen?
    Mehrsprachige Wörterbücher und Maschinelle Übersetzung


  1. Versteht der Computer meinen Text?
    Semantische Annotation und Künstliche Intelligenz

  2. Kann ich dem Computer meinen Text diktieren?
    Automatische Spracherkennung und Sprachgenerierung





Es sind keine Vorkenntnisse in Informatik erforderlich, aber Interesse an Computern ist erwünscht.


Beschränkter Zeitaufwand, da nur 2 Kreditpunkte


Studierende aus allen Fächern willkommen (Sprachen, Informatik, Psychologie,etc.). In der Germanistik, Romanistik und Anglistik ist die Vorlesung als curriculare Veranstaltung anrechenbar (siehe die jeweiligen Studienordnungen).



Anfragen ggf. bitte direkt an volk@cl.uzh.ch