[
Weiter
] [
Seitenende
] [
Überkapitel
]
3
Tokenisierung
3.1.2
Kodierung
3.1.3
Markup
3.1.4
Programme
3.2
XML
3.3
Tokenisierung
3.3.1
Problem
3.3.2
Punktdisambiguierung
3.3.3
Normalisierung
3.3.4
NER
3.4
Multilingualität
3.5
Vertiefung
3.5.1
Kontrollfragen
Lernziele
Kenntnis über den Zweck und die Probleme der textuellen Vorverarbeitung von natürlicher Sprache: Text-Segmentierung und Text-Normalisierung
Kenntnis über Methoden der Punktdisambiguierung und Satzendeerkennung
Kenntnis über Textnormalisierung und Erkennung von interessierenden Grössen (
Named
Entity Recognition
)
Kenntnis über die Kodierung sprachlicher Zeichen
Kenntnis und Umgang mit regulären Ausdrücken
[
Weiter
] [
Seitenbeginn
] [
Überkapitel
]