Computerlinguistik Uni Erlangen
Weiter:
Fünfte Sitzung
Zurück:
Unterlagen
Vorher:
Vierte Sitzung (Referat)
Vierte Sitzung - Das Lexikon in der Computerlinguistik (CL1),
der Computerlexikographie (CL2) und der Computerkorpuslinguistik
(CL3)
Was ist Computerlinguistik (CL1)?
- Sprachanalyse mit dem Computer
- Erstellung von Programmen für Analyse und Generierung von
natürlicher Sprache
- weniger anspruchsvolle Aufgaben
- Verarbeitung natürlicher Sprache (Natural Language
Processing - NLP)
- computergestützt, nicht Computer --- linguistisch, nicht
Sprachverarbeitung
- CL1 ist die computergestützte Sprachverarbeitung aus der
Sicht des Linguisten
- NLP ist die computergestützte Sprachverarbeitung aus der
Sicht des Informatikers
- technischer Ansatz für NLP
- kognitiver Ansatz im Rahmen der künstlichen Intelligenz für
CL1
Das Lexikon in CL1
- Lexikon als eine periphere Komponente betrachtet
- zunehmende Wichtigkeit des Lexikons
- Verbesserung des Lexikons ist nötig
- alle syntakischen, semantischen und pragmatischen
Informationen
- Aufbau, Inhalt und Spezifikation des Lexikons sind
zweckgebunden
Machine Translation - MT
- Lexika für maschinelle Übersetzung
- wenig mehr als Wortlisten
- Wörter der Quellsprache in Wörter der Zielsprache
übersetzen
- Ergebnisse waren wegen lexikalischen Ambiguität schlecht
bis unbrauchbar
englisch:
| brown
| französich:
| brun, marron, jaune
|
hindi:
| pila
| deutsch:
| gelb, orange, braun
|
deutsch:
| blau
| russisch:
| goluboj, sinij
|
- Behandlung der Ambiguitäten durch Nennung aller möglichen
Bedeutungen, resultiert in bedeutungslosen Text
- syntaktisches Parsen rückte in den Mittelpunkt des
Interesses
- lieferte auch enttäuschende Ergebnisse, weil keine
Bedeutungskomponente
- wiederbelebt durch Entwicklung wissensbasierter KI-Systeme
- Hinzufügen semantischer Information
- Menge des semantischen Wissens war größer als angenommen
- führte zur lexikalischen Wissensbasis
(Lexical-Knowledge-Bank - LKB)
- Übersetzung nicht von grammatischen Regeln, sondern vom
Systemwissen über einzelne Wörter gesteuert
- Für LKBs wird der Unterschied zwischen linguistischem und
enzyklopädischem Wissen völlig irrelevant
- Heutzutage bescheidenere Spezifikation des Lexikons:
- morphologische Informationen
- syntaktische Informationen
- semantische Informationen
- pragmatische Informationen
- im Falle von Sprachanwendungen auch phonologische
Informationen
Weiter:
Fünfte Sitzung
Zurück:
Unterlagen
Vorher:
Vierte Sitzung (Referat)
Oliver Lorenz
Jörg
Schreiber
zuletzt geändert am 14. Juli 1998