8.  Kondensation und Klassifikation von Texten

8.1 Zusammenfassung
8.1.1 Modell
8.1.2 Terminologie
8.1.3 Ansätze
8.2 IE
8.2.1 IE vs. IR
8.2.2 Klassische IE
8.3 Klassifikation
8.3.1 Kategorisieren
8.3.2 Clustering
8.4 Vertiefung

Lernziele 

Textverdichtung à la Wordle 


pict

Abbildung 8.1: Wordle

“Wordle” http://www.wordle.net generiert aus einer Definitionssammlung


Texttechnologie 
Das Problem der Bewirtschaftung von textueller Information hat verschiedenste “Aspekte”, welche meist “irgendwie” verwandt sind.

Textsortenzoo

Je nach Textsorte und gesellschaftlicher Textverwendung ergeben sich spezifische Anwendungen: technische Handbücher (oft riesig), Testberichte, Patente, Gesetzestexte, E-Mails, wissenschaftliche Texte, News usw.