9.2.  lexc: Ein Kompiler für Lexika

9.2.1.  Formalismus

Ein Formalismus für die lexikalische Ebene

lexc-Sprache

Die lexc-Sprache ist eine auf lexikographische Bedürfnisse zugeschnittene Notation für endliche Automaten und Transduktoren, welche konkatenative Morphologie inklusive Rechtsrekursion optimal unterstützt.

Aufbau einer lexc-Datei

  1. Optionale Deklarierung von verwendeten Mehrzeichensymbolen: Multichar_Symbols MC1 ... MCn
  2. Eine Folge von benannten Lexika: LEXICON Name
    , welche aus mindestens einem nachfolgendem Lexikoneintrag bestehen:
    Entry Continuation ;.
    Root ist das Startlexikon, # das Endlexikon.

Beispiel 9.2.1 (Lexikon mit leeren und rekursiven Fortsetzungsklassen ▸▸▸).


LEXICON Root   ! Kein ; hier!
        MEGA ;

LEXICON MEGA
mega    MEGA ; ! Rechtsrekursion
        ADJ  ; ! Leerer Eintrag

LEXICON ADJ
        cool # ;  ! oder
        gut  # ;  ! oder
        schlaff #;

Zustandsdiagramm des vorangehenden Lexikons


pict

Abbildung 9.4: Zustandsdiagramm eines lexc-Lexikons

Ausschnitt aus GERTWOL ▸▸▸

Multichar_Symbols +S +FEM  
 +SG +PL +NOM +AKK +DAT +GEN @U  
 
LEXICON Root  
* SUBST ;  
 
LEXICON SUBST  
mau_s S7+/f;  
 
LEXICON S7+/f  
        S7+/f/end;  
 
LEXICON S7+/f/end  
        Sg3/f/end;  
        Pl1+/f/end;

LEXICON Sg3/f/end  
+S+FEM+SG+NOM:0 #;  
+S+FEM+SG+AKK:0 #;  
+S+FEM+SG+DAT:0 #;  
+S+FEM+SG+GEN:0 #;  
 
LEXICON Pl1+/f/end  
+S+FEM+PL+NOM:e@U #;  
+S+FEM+PL+AKK:e@U #;  
+S+FEM+PL+DAT:en@U #;  
+S+FEM+PL+GEN:e@U #;  
! @U triggert Umlaut


pict

Abbildung 9.5: Zustandsdiagramm des GERTWOL-Ausschnitts

9.2.2.  Benutzerschnittstelle

Kompilieren von lexc-Dateien

Mit dem lexc-Werkzeug

$ lexc  
lexc>  compile-source lexicon.lexc  
Opening ’lexicon.lexc’...  
Root...1, SUBST...1, S7+/f...1, S7+/f/end...2, Sg3/f/end...4,  
Pl1+/f/end...4  
Building lexicon...Minimizing...Done!  
SOURCE: 1.6 Kb. 16 states, 22 arcs, 8 paths.

Mit dem xfst-Werkzeug

Mittels read lexc < lexicon.lexc lässt sich in xfst eine lexc-Datei ebenfalls in das entsprechende Netzwerk kompilieren.

Lexikalische Transduktoren mit lexc

Transduktoren

Lexikoneinträge der Form Wort1:Wort2 erzeugen Transduktoren .

Anwendungen

Drei-Ebenen-Morphologie in GERTWOL


pict

Abbildung 9.6: 3 Ebenen in GERTWOL [KOSKENIEMMI und HAAPALAINEN 1996, 123]