Finite State Morphologie des Deutschen

Effizienz

Also garantiert effizient?
  • read regex PLXX .o. PLX1 .o. PLX2 .o. PLX3 .o. PLX4 .o. PLX5 .o. PLX6;
    
    31.9 Mb. 84'131 states, 2'543'034 arcs, Circular.
    
  • Richtige Kombination der Regeln ist entscheidend.

  • "Generelle" Regeln mit vielen Wildcards nicht untereinander kombinieren, sondern nacheinander ans Lexikon anhängen.

Skalierbarkeit?
  • Aufgefüllte Adjektivklassen:
    108.7 Kb. 2'881 states, 4'849 arcs, 193'174 paths.
    
    Also keine grossen Befürchtungen.
zurück
April 2005 Luzius Thöny