Computerlinguistik Uni Erlangen
Weiter:
Zweite Sitzung
Zurück:
Unterlagen
Vorher:
Unterlagen
Erste Sitzung - Begriffsklärung
Enzyklopädie - Lexikon - Wörterbuch
- Enzyklopädie [zu griech. kýklos ,,Kreis``
und paideía ,,Bildung``], 1. nach Hippias von Elis, einem
Sophisten des 5.Jh. v.Chr., Begriff für die universale
Bildung, später allg. die Alltagsbildung, die nach
Isokrates (*436, +338) auf die wahre Bildung vorbereitet; seit
Marcus Terentius Varro (*116,+27) organisiert im System der
Artes liberales als Propädeutik der Philosophie, im MA
zudem auch der Theologie; in der Neuzeit dann seit dem
17./18.Jh., zunächst unter Einfluß der ->
Enzyklopädisten, Begriff für die Gesamtheit des
menschl. Wissens. - 2. die Darstellung der Bildungsinhalte und
Wissensgebiete bzw. -bereiche sowie einzelner
-gegenstände. Zu unterscheiden sind die systemat. E. und
die alphabet. E., oft unter dem Namen Allg. E.,
Universal-E. und Real-E. oder Reallexikon,
Sachwörterbuch und, bes. im 19.Jh.,
Konversationslexikon.
- Lexikon [zu griech. lexikón (biblíon)
,,das Wort betreffendes (Buch), Wörterbuch``], nach
Stichwörtern geordnetes Nachschlagewerk, das entweder ein
oder mehrere Sach- und Wissensgebiete (-> Enzyklopädie)
oder den Wortschatz einer oder mehrerer Sprachen, von Fach-,
Sonder-, Gruppensprachen usw. auflistet (-> Wörterbuch).
- Wörterbuch, Nachschlagewerk, das den Wortschatz
einer Sprache nach bestimmten Gesichtspunkten auswählt,
anordnet und erklärt; das W. gibt Sprachinformation,
während das Lexikon Sachinformationen bietet.
Lexikologie - Lexikographie
- Die Lexikologie analysiert den Inhalt eines Lexikons. Sie
untersucht und beschreibt den Wortschatz einer Sprache, in Hinblick
auf die Bedeutungsstruktur und die Zusammenhänge zwischen den
einzelnen Wörtern.
- Die Lexikographie dagegen beschäftigt sich mit der
formalen Darstellung des Inhalts eines Lexikons. Sie berücksichtigt
dabei einerseits die theoretischen Erkenntnisse der Lexikologie
andererseits die Anforderungen der Benutzer.
Teilgebiete der Computerlinguistik
- Die Computerlinguistik (CL1) beschäftigt sich
mit NLP-Systemen und benötigt hierfür Lexika.
- Die Computerlexikographie (CL2) erstellt, wie die
herkömmliche Lexikographie auch, die
Wörterbücher. Sie verwendet dabei zur Erstellung,
Verwaltung und Nutzung computergestüzte Methoden.
- Die Computerkorpuslinguistik (CL3) betrachtet
große Textmengen (Korpora) von aktueller Sprache um daraus
Erkenntnisse für die Linguistik allgemein oder die
Computerlinguistik im speziellen zu gewinnen.
Lexikon
Was ist ein Lexikon?
- Früher war ein Lexikon ein Wörterbuch, welches nur
die Bedeutung der Wörter lehrte.
- Heute ist ein Lexikon das Vokabular einer Sprache und bietet
eine Menge an linguistischer Information.
Definitionen
Grimes (1988)
- Ein Lexikon ist ein von einer linguistischen Theorie
definiertes Objekt.
- Ein Wörterbuch extrahiert die Informationen aus dem
Lexikon und bietet sie in bestimmter Form dar.
- Ein Lexikon enthält alle Wörter und deren
Eigenschaften.
- Eine Grammatik beschreibt die Verbindung der Wörter und
deren Eigenschaften.
Bennet (1986)
- Eine Grammatik stellt eine Menge von Regeln zur
Verfügung.
- Ein Lexikon ist eine Menge von Wörtern und
Ausdrücken.
- Die Verwendung der Wörter wird durch die Regeln
gelenkt.
Mel'cuk (1992)
- Ein Lexikon (oder Wörterbuch) ist eine spezifische
Liste von lexikalischen Einheiten einer Sprache.
- Die lexikalischen Einheiten werden in einer spezifischen Art
und Weise angeordnet und mit spezifischer Information verbunden.
- Die Liste wurde für eine spezifische Anwendung
erstellt.
Makkai (1980) Assoziatives Lexikon
- Ein Lexikon ist ein Information-Retrieval-System.
- Das Information-Retrieval-System enthält in visueller
und auditiver Form das Wissen eines nativen Sprechers über
die Lexis seiner Sprache.
- Das menschlich Gehirn beinhaltet ein solches mentalen
Lexikon.
- Das Information-Retrieval-System kann Lexeme frei
miteinander assoziieren.
Wort
Wort ist ein intuitiv vorgegebener und Umgangssprachlich
verwendeter Begriff für sprachliche Grundeinheiten. Die
sprachwissenschaftlichen Definitionen sind uneinheitlich und
werden kontrovers diskutiert.
- Auf phonetisch-phonologischer Ebene werden die Wörter
durch Wortakzente und Grenzsignale wie Pause, Knacklaut und
andere theoretisch isolierbare Lautsignale voneinander
unterschieden.
- Auf orthographisch-graphemischer Ebene geschieht dies durch
Leerstellen im Schriftbild.
- Auf morphologischer Ebene unterscheidet man Wörter als
die Grundeinheiten von grammatischen Flexionsparadigmen, da
diese strukturell stabil, nicht trennbar und durch spezifische
Wortbildungsregeln beschreibbar sind.
- Auf lexikalisch-semantischer Ebene werden die Wörter
dadurch unterschieden, daß sie die kleinsten relativ
selbständigen Träger von Bedeutung sind, die im
Lexikon kodifiziert werden kann.
- Unter dem syntaktischen Aspekt unterscheidet man Wörter
als die kleinsten verschiebbaren und unterscheidbaren Teile
eines Satzes.
Lexem - Wortform
- Das Lexem (= type) ist die abstrakte Basiseinheit des
Lexikons auf der Ebene der Langue, welches in verschiedenen
grammatischen Wortformen realisiert werden kann.
- Eine Wortform (= token) ist die auf der Ebene der
Parole konkret realisierte grammatische Form eines Lexems.
Morphem - Allomorph
- Das Morphem ist das kleinste bedeutungstragende
Element der Sprache. Morpheme sind ebenfalls abstrakte Einheiten
auf der Ebene der Langue, welche durch Allomorphe realisiert
werden.
- Ein Allomorph ist eine der konkreten Realisierungen
desselben Morphems.
Lexikoneintrag - Lemma
- Der Lexikoneintrag (Lexical Entry) ist die komplette
linguistische Information zu einem Lexem in einem Lexikon.
- Das Lemma ist der Schlüssel unter dem der
Lexikoneintrag eines Lexems gefunden werden kann.
Weiter:
Zweite Sitzung
Zurück:
Unterlagen
Vorher:
Unterlagen
Oliver Lorenz
Jörg
Schreiber
zuletzt geändert am 14. Juli 1998