Assoziative oder semantische Netze stellen einen Repräsentationsformalismus dar, der besonders auf dem Gebiet der Verarbeitung natürlicher Sprache weite Verbreitung gefunden hat. Während die Idee, die dieser Darstellungsform zugrundeliegt, recht einfach ist, läßt sich eine präzise Definition des zugrundeliegenden Formalismus zur Klärung von komplizierteren Fällen in der Literatur nicht finden. Vielmehr gibt es eine Reihe von unterschiedlichen Varianten, so daß nicht einmal eindeutig feststeht, was unter semantischen Netzen genau zu verstehen ist (weder allgemein noch innerhalb der einzelnen Varianten). Wir folgen zunächst weitgehend dem Verständnis, das in [Sch76] zu erkennen ist (siehe auch die tiefreichende Analyse von [Woo75]). Eine Relativierung wird dann anschließend vorgenommen.
Mit Schubert fassen wir assoziative Netze als eine graphische Darstellung
einer Datenstruktur auf, mit der sich Sachverhalte illustrieren lassen. In
Abbildung 2.3 ist die Aussage ``mein rotes Auto ist auf dein weißes
Auto aufgefahren'' als ein solches Netz graphisch dargestellt. Der Graph
besteht aus einer Reihe von markierten Knoten, die auch
Konzeptknoten genannt werden. Diese sind mit markierten, gerichteten
Kanten verbunden. In diesem einfachen Fall entspricht jeder Kante zusammen mit
den verbundenen Knoten eine Elementaraussage, die in der Gesamtaussage
mitenthalten ist. ``die Farbe meines Autos ist rot'', ``mein Auto gehört
zur Menge der Autos'' usw. sind im vorliegenden Beispiel solche
Teilaussagen.
Abbildung 2.3: Ein assoziatives Netz
Was ist die allgemeine Struktur eines solchen Graphen, was bedeutet er, wofür stehen die Knoten, wofür die Kanten, wie bestimmt sich ihre Richtung? Um diesen Fragen auf die Spur zu kommen, hat Schubert eine geringfügige Darstellungsänderung vorgenommen, die anhand von Abbildung 2.4 erläutert ist. Dort findet sich eine der Teilaussagen aus unserem vorangegangenen Beispiel in einer ausführlicheren Form und in der verkürzten Form, wie sie bereits in Abbildung 2.3 verwendet wurde. Anhand dieser Darstellung wollen wir nun die obigen Fragen beantworten.
Abbildung 2.4: Aussagediagramm in ausführlicher und verkürzter Form
Die kleinste Informationseinheit in einem assoziativen Netz ist ein atomares Netzstück wie das in Abbildung 2.4 dargestellte Netz. Es besteht aus einem (unmarkierten) Aussageknoten (jeweils als ein kleiner Kreis dargestellt) und einer (geordneten) Folge von markierten Nachfolgeknoten (jeweils als Oval dargestellt, das die Markierung umschließt). Die markierten Knoten heißen auch Konzeptknoten. Die Markierungen von Konzeptknoten sind Namen von Individuen, Objekten (wie ``mein Auto'', ``das Rot meines Autos'' etc.), Mengen von solchen Individuen oder Objekten sowie von prädikativen Konzepten (wie ``Farbe'' etc.). Der erste Knoten in der Folge ist immer mit einem prädikativen Konzept markiert. Die Ordnung unter den Nachfolgeknoten kann auch durch zusätzliche Markierungen (zB. mit den Ziffern 1, 2 usw.)\ bewerkstelligt werden, wovon wir bei den einfachen Beispielen in unseren Abbildungen absehen.
Abbildung 2.5 zeigt ein atomares Netzstück mit zwei,
Abbildung 2.6 ein solches mit vier Konzeptknoten, jeweils in der
vollen sowie in der verkürzten Darstellung. Damit ist auch die
eineindeutige Beziehung der beiden Formen untereinander illustriert. Die
Markierung des ersten Knotens geht über in die Markierung der Kante (und
umgekehrt), wobei der Aussageknoten verschwindet. Die Kantenrichtung in der verkürzten Darstellung hängt von
der Anzahl der Knoten in der illustrierten Weise ab. Bei einem einzigen Knoten
weist die Kante immer in Richtung des Knotens, bei zwei Knoten vom ersten hin
zum zweiten, und bei mehr als zwei Knoten hin zu jedem Knoten, wobei im
letzteren Fall die Reihenfolge der Kanten durch Markierungen oder durch
Konventionen (zB. im Uhrzeigersinn links vom Prädikat beginnend)
festzulegen ist. So ist immer eindeutig zu erkennen, welches die Reihenfolge der
Knoten ist, auch wenn im (häufigsten) Fall von zwei Knoten eine Ordnung aus
der geometrischen Darstellung allein nicht ablesbar wäre.
Abbildung 2.5: Atomares Netzstück mit zwei Konzeptknoten
Abbildung 2.6: Atomares Netzstück mit vier Konzeptknoten
Unsere Darstellung ist sehr stark geprägt vom Verständnis, das sich ergibt, wenn man semantische Netze als Darstellungen logischer Formeln auffaßt. Nur so erscheint es möglich, aus der Vielfalt der in der Literatur vorhandenen Netzvarianten ein einheitliches Konzept zu extrahieren. Dies führt aber zum Beispiel dazu, daß die verkürzte Netzdarstellung der Abbildung 2.5 unüblich ist. Man hat sich in der Wissensrepräsentation nämlich weitgehend auf die Verwendung zweistelliger Prädikate eingeschworen. Konzeptuell ist das sehr fragwürdig, mag die daraus resultierende Einfachheit auch noch so bestechen.
Aus logischer Sicht macht uns dies jedoch keine Probleme, läßt uns doch die Prädikatenlogik bei der Wahl des Prädikats große Freiheit. Insbesondere können wir hier entweder ist_eine_Stadt (wie geschehen) oder lediglich ist als Prädikat wählen. Im letzteren Fall ergibt sich ist(Nürnberg,Stadt), dessen Diagramm (vgl. Abbildung 2.4) für diesen Fall gebräuchlicher ist.
Die Darstellung eines drei- oder mehrstelligen Prädikats mittels
ausschließlich zweistelligen Prädikaten läßt sich auf
verschiedenste Weisen bewerkstelligen. Eine simple Lösung besteht darin,
zB. das Objekt ``Buch'' in unserem Beispiel mit in das Prädikat zu ziehen,
also Gibt_Buch(john,mary). Eine weitere besteht in der Vorstellung
einer solchen atomaren Aussage als ein Ereignis , im vorliegenden
Fall ein Geben-Ereignis [Nil80], und der Verknüpfung dieses
Ereignisses mit den einzelnen Objekten in der Weise Geber(e,john)
Nehmer(e,mary)
Objekt(e,buch). Eine weitere Möglichkeit
besteht in der Einführung von Knoten, die zwei Objekte oder einen
neueingeführten Knoten mit einem weiteren Objekt verbinden, wobei sich die
Frage nach der Bedeutung der neuen Knoten ergibt, der wir an dieser Stelle
nicht mehr nachgehen werden. Spätere Beispiele werden illustrieren, welche
Lösungen in der Wissensrepräsentation hierfür heute gebräuchlich sind.
Stellt man die durch das Netz der Abbildung 2.4 repräsentierte prädikatenlogische Aussage Farbe(mein_Auto,rot) als gaG dar wie im vorigen Abschnitt besprochen, so erhält man exakt die gleiche graphische Darstellung wie das Netz in der ausführlichen Fassung. Das Gleiche gilt für die Beispiele der Abbildungen 2.5 und 2.6, ja es gilt ganz allgemein. Mit anderen Worten, assoziative Netze können als die gaG-Darstellungen der entsprechenden logischen Formeln aufgefaßt werden. Im Sinne von Brachman (siehe Abschnitt 1.5.3) ist dies die Sicht auf der logischen Ebene. Diese Aussage läßt sich als eine erneute Bestätigung für die große Tragweite der Prädikatenlogik interpretieren. Sie bestätigt aber auch die Wichtigkeit der gewählten Formelrepräsentation, auf die wir in Abschnitt 2.3 bereits hingewiesen haben und auf die wir in Abschnitt 2.11.13 nochmals zu sprechen kommen.
Nach dieser allgemeinen Feststellung scheint es sich nicht zu lohnen, assoziative Netze noch weiter in allen Einzelheiten zu erörtern, da sich über die nunmehr vorausgesetzte Kenntnis der Prädikatenlogik keine wesentlichen Gesichtspunkte mehr ergeben dürften. Leider ist diese Darstellung zu simplifizierend, um einen allumfassenden Eindruck zu vermitteln. Da uns hierfür der Raum fehlt, wollen wir versuchen, den Eindruck durch die folgende Sammlung von weiteren Anmerkungen abzurunden.
Wie wir für diesen speziellen Fall kurz vorher gesehen haben, wird in der
verkürzten Darstellung die Kantenrichtung vom ersten zum zweiten Argument
gelegt. In aller Regel findet diese Unsymmetrie ihren Niederschlag in einer
dadurch suggerierten Interpretation einer funktionalen
Abhängigkeit des zweiten vom
ersten Argument. So gibt es im Beispiel der Abbildung 2.3 zu jedem Auto
eine Farbe (aber nicht notwendigerweise zu jeder Farbe auch ein Auto). So
gesehen entspricht der mit ``Farbe'' markierte Knoten im Netz der
Abbildung 2.3 eigentlich einem Funktionszeichen statt des verwendeten
Prädikatszeichens. In dieser Lesart stellt die Abbildung 2.3 die
Aussage dar; oder, um es
datenbanktechnisch auszudrücken, das erste Argument fungiert als ein
Schlüssel. In dieser funktionalen
Interpretation zweistelliger Prädikate dürfte auch der Grund liegen, warum Terme in
semantischen Netzen selten ([Cer75] ist eine der Ausnahmen) explizit
dargestellt werden.
Weiter bemerken wir noch einmal explizit, daß unsere Darstellung in einem trivialen Punkt von der Schuberts abweicht, da wir einen geordneten Graphen vorweg vorausgesetzt haben, während Schubert diese Ordnung durch Markierungen (PRED, A, B, C usw.) bewerkstelligt hat.
Es gibt noch einen wichtigeren Unterschied zwischen den gaG-Darstellungen auf
der einen Seite und den verkürzten Netzen auf der anderen. Betrachten wir
zum Beispiel die Aussage . Sowohl in dieser linearen
(eindimensionalen) Darstellung als auch in der gaG-Darstellung ist eine
Reihenfolge der beiden Teilaussagen festgelegt (auch dann, wenn man formal die
Nachfolgerknotenmenge als ungeordnet betrachtet). Eine solche Reihenfolge ist
in der verkürzten Darstellung dagegen nicht bestimmt.
Die letztere realisiert daher implizit die
Kommutativität der Konjunktion. Darin mag mit ein Grund für das
leichtere kognitive Erfassen liegen (denn auch in der Welt sind verschiedene
Eigenschaften eines Objekts nicht nach einer ersichtlichen Reihenfolge
angeordnet). Im Hinblick auf die Effizienz der Implementierung ist damit noch
nichts ausgesagt, da in einer konkreten Datenstruktur für solche Netze
dieser Vorteil in aller Regel wieder verloren geht, weil dort meist wieder
Eindimensionalität herrscht.
Andererseits wird in der verkürzten Darstellung des Beispiels das
Prädikat zweimal repräsentiert (als Markierung zu jeder der beiden
Kanten). Dies kann in der gaG-Darstellung in gleicher Weise der Fall
sein, darüber hinaus erlaubt die gaG-Darstellung jedoch auch diese
Redundanz zu eliminieren und das nur einmal zu repräsentieren, wie
es in Abbildung 2.1 geschehen ist.
Wie in Abschnitt 1.5.3 betont, entscheidet über die Qualität
eines Formalismus das Komplexitätsverhalten bei der Ausführung der
erforderlichen Operationen. Objektnetze aller Art (also
natürlich auch Logikformeln in gaG-Darstellung) erlauben einen optimalen
Zugriff auf die Objekte und damit auch auf ihre (angehängten)
Eigenschaften (zB. mit konstantem Aufwand, dh. , bei
Verwendung von ``hashing'' Techniken). Damit ergibt sich auch
ein leichtes Einfügen neuer Objekte samt ihrer
Eigenschaften in das Netz, da irgendwelche in diesen Eigenschaften
vorkommenden Objekte sofort lokalisiert (und konnektiert) werden können.
Das Entfernen ist entsprechend noch einfacher. Wegen der (Fast-)
Ununterscheidbarkeit von assoziativen Netzen und gaG-Formeln gilt für
beide das gleiche Verhalten hinsichtlich logischer Inferenz. Bezüglich des
modus ponens werden wir das in Abschnitt 2.6 demonstrieren.
Assoziative Netze haben mannigfache historische Wurzeln, unter anderem in der Gestaltpsychologie. Innerhalb der Intellektik wird die Dissertation von Quillian (vgl. [Qui67]) als der Ausgangspunkt anerkannt. Seine Idee war, mit semantischen Netzen praktisch den Inhalt eines Wörterbuchs zu repräsentieren (vgl. die linguistische Ebene des Abschnitts 1.5.3). So zeigt die Abbildung 2.7 drei solcher ``Wörterbucheinträge''. Die Ovale stellen die Typknoten dar, die übrigen Knoten (engl. tokens) sind über Verweise mit den entsprechenden Typknoten verbunden, wo deren eigentliche Definition gegeben ist. Die volle Bedeutung eines durch einen Typknoten dargestellten Konzeptes ist nach Quillian in der Menge der von ihm aus erreichbaren Knoten dargestellt. Sowohl diese Darstellung als auch eine spätere Variante von Quillian ist durch die Schubertsche Analyse abgedeckt.
Abbildung 2.7: Drei Bedeutungen von ``Band'' laut Duden.
In den Siebziger Jahren hatte man innerhalb einer bestimmten Schule die Hoffnung, daß sich atomare Aussagen mittels einer höheren konzeptuellen Struktur besser verstehen lassen als mit der prädikatenlogisch-syntaktischen. Diese Hoffnung wurde durch die Beobachtung genährt, daß in vielen atomaren Aussagen die Rollen der Prädikate und Argumente untereinander trotz inhaltlicher Unterschiede recht ähnlich sind (vgl. zB. die Aktionsprädikate ``geben'' und ``sagen''). Ein herausragender Vertreter dieser Schule war R. Schank, der bereits in die Struktur atomarer Netzstücke einen stärkeren semantischen Gehalt im Sinne von Abschnitt 2.1 zu verlagern versuchte [Sch72, SR74].
Eine solche konzeptuell als primitiv angesehene Relation ist in
Abbildung 2.8 in Schanks eigener Notation zu dem Beispiel aus
Abbildung 2.6 (jedoch hier mit fünf Konzeptknoten)
dargestellt ( darin steht für Objekt,
für
Nehmer). Schank spricht von einer Darstellung der konzeptuellen
Abhängigkeiten (engl.
conceptual dependency representation). Allgemeiner spricht man hier auch von einer
Kasusstruktur (engl. case structure). Als Kasus wird dabei der Name einer bestimmten Rolle
verstanden, die eine
Substantivphrase im Zustand oder in der Aktivität spielt, der
oder die durch das Verb eines Satzes ausgedrückt wird (im nächsten
Abschnitt werden wir dieser Idee unter dem Namen ``Schlitz''
oder ``slot'' wiederbegegnen). Man spricht bei den zugehörigen
Kanten von strukturellen (im Gegensatz zu Aussage-)
Kanten. Zum Vergleich einer solchen Struktur
mit der bisherigen Netzdarstellung ist das entsprechende atomare
Netzstück, zur Verdeutlichung der geometrischen Analogie mit Schuberts
Ordnungsmarkierungen, mit angegeben. Der Unterschied erweist sich
offensichtlich als syntaktischer Puderzucker.
Abbildung 2.8: Konzeptuelle Abhängigkeiten
Damit sei jedoch nicht in Abrede gestellt, daß in der natürlichen
Sprache verschiedene Aussagen mit einer gewissen Ähnlichkeit strukturell
ähnlich behandelt werden, wodurch das Sprachverständnis
unterstützt werden könnte. Prädikatenlogisch ausgedrückt
hieße das, daß gewisse Stelligkeiten bei Prädikaten (evtl. einer
bestimmten Klasse) bevorzugt werden und die einzelnen Stellen in stereotyper
Weise behandelt werden, so daß schon von der syntaktischen Struktur her
eine semantische Interpretation zum Teil dispositioniert ist. Ob es sich dabei
wirklich, wie behauptet, um primitive
Relationen handelt, sei dahingestellt.
Unterstellt man dies, so würde man die Schubertschen Kantenmarkierungen
nicht als bloße Ordnungsmarkierungen, sondern als echte relationale
Konzepte auffassen, wie es in [Sim73] geschieht. Zum Beispiel hätte
man anstelle der Markierung eine prädikative Beziehung
Akteur(a,b), dh.
(im Beispiel Karl) ist der Akteur in der
Aktion
, was impliziert, daß
belebt und
eine Aktion
ist. Ähnliches gilt für die weiteren Kanten.
Wir wollen hier über den soeben beschriebenen Ansatz (der in anderem Gewand im folgenden Abschnitt über Konzeptrahmen wieder auftaucht) kein abschließendes Urteil fällen. Wer sich jedoch an die erbitterten Wortgefechte jener Zeit noch erinnert, die auch in der Literatur ihren Niederschlag gefunden haben, wird nunmehr erkennen, daß sie meist an der Sache vorbeigingen, indem sie sich für oder gegen einen bestimmten Formalismus (etwa die Prädikatenlogik) gerichtet haben. Insbesondere mußte man erkennen, daß diese Netze nicht mehr semantischen Gehalt vermitteln, als es die entsprechenden prädikatenlogischen Formeln (in einer bestimmten Repräsentation und gegebenenfalls durch Kasusstrukturen angereichert) tun. Genau aus diesem Grunde ist man heute zur Bezeichnung ``assoziative Netze'' übergegangen.
Einer der wesentlichen Gründe für die Popularität der assoziativen Netze ist zweifelsohne ihre Anschaulichkeit in Verbindung mit einer besonders für die Zwecke der Verarbeitung natürlicher Sprache (dh. die dafür erforderlichen Operationen) geeigneten Datenstruktur. Leider reicht die Anschaulichkeit nur bis zu den bisher illustrierten Beschreibungen. Integriert man den gesamten logischen Apparat, wie es Schubert getan hat, so geht diese Anschaulichkeit sofort verloren. Ein Blick auf die gaGs der Abbildungen 2.1 und 2.2 kann dies bestätigen. Die so dargestellten Formeln sind bei weitem nicht mehr so gut lesbar wie in der logischen Standardnotation. Wie wir oben gesehen haben, sind diese gaGs im wesentlichen identisch mit den entsprechenden assoziativen Netzen. Um diesen Standpunkt jedoch noch explizit zu verdeutlichen, geben wir in Abbildung 2.9 das assoziative Netz von Abbildung 14 aus [Sch76] ohne weitere Erläuterung, nur zur Illustration, wieder, so daß sich der Leser selbst ein Bild von der verbliebenen Anschaulichkeit zu machen vermag.
Für seinen Teil zieht der Autor selbst hieraus den Schluß, daß es nach wie vor besser ist, die logische Standardnotation als allgemeinen Referenzpunkt auf der Ebene des Experten beizubehalten, die assoziativen Netze ausschließlich im Sinne der gaG-Darstellung von logischen Formeln aufzufassen (wodurch insbesondere ihre Semantik mitgeliefert wird) und daher, außer in einfachsten Ausnahmefällen, nur auf der Ebene des Wissensingenieurs in Betracht zu ziehen. Diese klare Trennung von syntaktisch präziser Darstellung als logische Formel und Kompaktierung im Sinne einer effizienten Behandlung erscheint mir überzeugender als die in assoziativen Netzen angestrebte, aber nicht überzeugend gelungene Mischung beider (ja sogar weiterer in Abschnitt 1.5.3 genannter) Ziele. Die konzeptuelle Strukturierung ist dann nochmal etwas von dieser Sprachstruktur Verschiedenes, worauf wir im folgenden Abschnitt weiter eingehen.
Christoph Quix, Thomas List, René Soiron