[ Weiter ] [ Seitenende ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]
Typisches Problem bei Volltextsuche
Benutzende erhalten zuviele Treffer! Was tun?
Typisches Problem bei OPAC-Suche zu Titel/Schlagwort
Benutzende erhalten zuwenige Treffer! Was tun?
Automatische Indexierung: Extraktion und Addition
Definition nach [NOHR 2003, 20]
Zur automatischen Indexierung werden alle Verfahren gezählt, “die vollautomatisch Dokumente analysieren und abgeleitet aus dieser Analyse entweder
Entstehung
Von der klassischen Metainformation bis zum Volltext
Anreicherung des klassischen Bibliothekskatalogs
Inhaltsverzeichnisse (TOC)
Eingescannte und in Text konvertierte Inhaltsverzeichnisse erlauben mehr Treffer.
Beispiel 2.1.1 (Landesbibliothek Vorarlberg).
Elektronisches Inhaltsverzeichnis
|
Beispiel: Halbautomatisches Indizieren von TOC
Projekt der Landesbibliothek Bregenz mit intelligentCapture der Firma AGI
Vorgehen zur Erschliessung von Inhaltsverzeichnissen
Aktueller Stand gemäss http://www.dandelon.com: 138’000
Exkurs: Nutzungsverhalten bei OPAC mit TOC
Einfluss online-verfügbarer Inhaltsverzeichnisse (TOC) auf die Benutzung nach [MORRIS 2001]
Resultate
Grad an informationslinguistischer Aufbereitung
Automatische Indexierung mit IDX/MILOS
IDX: Linguistisches Indexierungsverfahren von H. Zimmermann
Für DE/FR/EN: Stoppwörter, Grundformermittlung, Derivation und Dekomposition, Wortbindestrichergänzung, Erkennung von Synonym- und Hypernymbeziehungen aus Schlagwortnormdatei, Mehrworterkennung, wortbasierte Übersetzung
Motivation und Ziele für MILOS: Maschinelle Indexierung zur verbesserten Literaturerschliessung in Online-Systemen
|
Automatisches Indexieren: Probleme
|
Hilft automatisches Indexieren?
Retrieval-Evaluation
Wie lässt sich der Nutzen quantifizieren ? Wieviele Treffer sind schlecht (Ballast)? Wieviele Treffer fehlen (Stille)?
Precision eines Systems
Anteil der korrekten Treffer an allen gelieferten Treffern
Recall (Ausbeute) eines Systems
Anteil der korrekten Treffer an allen grundsätzlich möglichen Treffern
Retrieval-Evaluation MILOS I 1994 [LEPSKY et al. 1996]
Basis
50 Suchanfragen mit 876 relevanten Titeln aus 40’000 Dokumenten
Tests
Folgerungen
Gemittelte vs. total aufgerechnete Precision/Recall
RecallPrecision10%20%30%40%50%60%70%80%90% A B C
Gemittelte Werte RecallPrecision10%20%30%40%50%60%70%80%90% A B C
Total aufgerechnete Werte
Retrieval-Evaluation [OBERHAUSER und LABNER 2003]
Basis: 100 Suchanfragen über 72’000 Dokumenten
Retrieval-Evaluation [OBERHAUSER und LABNER 2003]
Resultate
|
Integration
von automatischer mit intellektueller Erschliessung unterschiedlicher Ausprägung (Schlagwort, Schlagwortkette, Klassifikation)
Suchterm-Indexierung
Gleichbehandlung von Suchtermen des Benutzers und OPAC-Daten ermöglichen, d.h. Online-Indexieren von Suchanfragen zu Indexaten
Kooperation und Sharing: Bibliotheksverbünde
Nicht jede Bibliothek muss z.B. alle Inhaltsverzeichnisse einscannen und automatisch indexieren! Digitalisierte Information lässt sich einfach distribuieren.
Herausforderungen in der näheren Zukunft
[ Weiter ] [ Seitenbeginn ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]