Computerlinguistik in Information und Dokumentation
Folienskripte in PDF
Selbst experimentieren zu Themen aus Teil 1
- Morphologie
- CANOO www.canoo.net Wortbildungsanalyse und morphologische Analyse
- GERTWOL: http://www.lingsoft.fi/cgi-bin/gertwol Morphologische Analyse
- Experimentiervorschlag 1: Man nehme einen Artikel aus einer Zeitung oder ein Suchresultat aus einem OPAC und teste das exotischste und das gewöhnlichste Wort darin.
- Experimentiervorschlag 2: Man gebe bei www.google.de und www.yahoo.de das Suchwort "Strukturierung" ein. Worin unterscheiden sich die beiden Suchmaschinen in der morphologischen Behandlung von Wörtern?
- Übersetzung
- Zusammenfassung
- Web-Seite zum Thema "Zusammenfassung"
- Textkompression
- Word-Datei Maschinelle Indizierung auf dem Prüfstand
- Experimentiervorschlag: Man nehme den Link und reduziert auf 20%. Wie ist die Textkohärenz? Man vergleiche die Kompression, welche Word machen kann (Menu Extra: Textzusammenfassung), mit derjenigen von Pertinence. Was sind die Unterschiede?
Selbst experimentieren zu Themen aus Teil 2
- intelligentCapture der Firma AGI
- Experimentiervorschlag: Suchen Sie nach Dokumenten zum Autor "Jewgeni Charitonow" im Katalog der Vorarlberger Landesbibliothek. Suchen Sie nach "Jewgeni Charitonow" bei www.dandelon.com und klicken Sie dann den Dokumentitel "Russische Liebesgeschichten" an. Sie sehen dann das automatische Indexat, die intellektuelle Beschlagwortung sowie das Inhaltsverzeichnis als PDF. Wie schätzen Sie die Indexate ein? Wo hat es Probleme und auf welcher Stufe der Verarbeitung sind sie wohl anzusiedeln?
- AUTINDEX mit Klassifikation über Abstracts ausprobieren http://www.iai.uni-sb.de/~bindex/bindex-de-demo.html
- Nachtrag zur Frage zu Folie 10: In der von mir als Test C bezeichneten Evaluation sind die Schlagwörter nicht drin (siehe Abschnitt 2.4 bzw. 3)
Hintergrundinformation (soweit nicht schon oben verlinkt)
Das ältere (von mir leicht aktualisierte) Fliesstextskript von Prof. Dr. M. Hess (Vorgängerdozent) mit Schwerpunkt linguistische Ansätze und Volltextsuche, Informationgewinnung, Abschnitt zu Maschineller Übersetzung und Zusammenfassung.
- Zu Teil 1
- Zu Textzusammenfassung: K. Zechner (1997): A Literature Survey on Information Extraction and Text Summaration
- Hans Peter Luhn (1958): Automatic Creation of Literature Abstracts (PDF)
- Zu Teil 2
- Nohr, H. (2003): Grundlagen der automatischen Indexierung: Ein Lehrbuch. Berlin: Logos-Verlag
- IDX-System
- MILOS-Projekt-Homepage mit wichtigen Reports online
- Studie Oberhauser/Labner (2003): Einführung der automatischen Indexierung im österreichischen Verbundkatalog? Bericht über eine empirische Studie (via Homepage von ODOK '03)
- Studie Morris/Mondragon (1998): Poster Session "Online Tables of Contents: Impact on Usage"
- Morris, R. (2001). Online tables of contents for books: The user’s perspective. Doctoral dissertation, University of Michigan.