Nächste Seite: 2.5 Konzeptrahmen Vorige Seite: 2.3.4 Sprache und Logik

2.4 Assoziative Netze

Assoziative oder semantische Netze stellen einen Repräsentationsformalismus dar, der besonders auf dem Gebiet der Verarbeitung natürlicher Sprache weite Verbreitung gefunden hat. Während die Idee, die dieser Darstellungsform zugrundeliegt, recht einfach ist, läßt sich eine präzise Definition des zugrundeliegenden Formalismus zur Klärung von komplizierteren Fällen in der Literatur nicht finden. Vielmehr gibt es eine Reihe von unterschiedlichen Varianten, so daß nicht einmal eindeutig feststeht, was unter semantischen Netzen genau zu verstehen ist (weder allgemein noch innerhalb der einzelnen Varianten). Wir folgen zunächst weitgehend dem Verständnis, das in [Sch76] zu erkennen ist (siehe auch die tiefreichende Analyse von [Woo75]). Eine Relativierung wird dann anschließend vorgenommen.

Mit Schubert fassen wir assoziative Netze als eine graphische Darstellung einer Datenstruktur auf, mit der sich Sachverhalte illustrieren lassen. In Abbildung 2.3 ist die Aussage ``mein rotes Auto ist auf dein weißes Auto aufgefahren'' als ein solches Netz graphisch dargestellt. Der Graph besteht aus einer Reihe von markierten Knoten, die auch Konzeptknoten genannt werden. Diese sind mit markierten, gerichteten Kanten verbunden. In diesem einfachen Fall entspricht jeder Kante zusammen mit den verbundenen Knoten eine Elementaraussage, die in der Gesamtaussage mitenthalten ist. ``die Farbe meines Autos ist rot'', ``mein Auto gehört zur Menge der Autos'' usw. sind im vorliegenden Beispiel solche Teilaussagen.

Abbildung 2.3: Ein assoziatives Netz

Was ist die allgemeine Struktur eines solchen Graphen, was bedeutet er, wofür stehen die Knoten, wofür die Kanten, wie bestimmt sich ihre Richtung? Um diesen Fragen auf die Spur zu kommen, hat Schubert eine geringfügige Darstellungsänderung vorgenommen, die anhand von Abbildung 2.4 erläutert ist. Dort findet sich eine der Teilaussagen aus unserem vorangegangenen Beispiel in einer ausführlicheren Form und in der verkürzten Form, wie sie bereits in Abbildung 2.3 verwendet wurde. Anhand dieser Darstellung wollen wir nun die obigen Fragen beantworten.

Abbildung 2.4: Aussagediagramm in ausführlicher und verkürzter Form

Die kleinste Informationseinheit in einem assoziativen Netz ist ein atomares Netzstück wie das in Abbildung 2.4 dargestellte Netz. Es besteht aus einem (unmarkierten) Aussageknoten (jeweils als ein kleiner Kreis dargestellt) und einer (geordneten) Folge von markierten Nachfolgeknoten (jeweils als Oval dargestellt, das die Markierung umschließt). Die markierten Knoten heißen auch Konzeptknoten. Die Markierungen von Konzeptknoten sind Namen von Individuen, Objekten (wie ``mein Auto'', ``das Rot meines Autos'' etc.), Mengen von solchen Individuen oder Objekten sowie von prädikativen Konzepten (wie ``Farbe'' etc.). Der erste Knoten in der Folge ist immer mit einem prädikativen Konzept markiert. Die Ordnung unter den Nachfolgeknoten kann auch durch zusätzliche Markierungen (zB. mit den Ziffern 1, 2 usw.)\ bewerkstelligt werden, wovon wir bei den einfachen Beispielen in unseren Abbildungen absehen.

Abbildung 2.5 zeigt ein atomares Netzstück mit zwei, Abbildung 2.6 ein solches mit vier Konzeptknoten, jeweils in der vollen sowie in der verkürzten Darstellung. Damit ist auch die eineindeutige Beziehung der beiden Formen untereinander illustriert. Die Markierung des ersten Knotens geht über in die Markierung der Kante (und umgekehrt), wobei der Aussageknoten verschwindet. Die Kantenrichtung in der verkürzten Darstellung hängt von der Anzahl der Knoten in der illustrierten Weise ab. Bei einem einzigen Knoten weist die Kante immer in Richtung des Knotens, bei zwei Knoten vom ersten hin zum zweiten, und bei mehr als zwei Knoten hin zu jedem Knoten, wobei im letzteren Fall die Reihenfolge der Kanten durch Markierungen oder durch Konventionen (zB. im Uhrzeigersinn links vom Prädikat beginnend) festzulegen ist. So ist immer eindeutig zu erkennen, welches die Reihenfolge der Knoten ist, auch wenn im (häufigsten) Fall von zwei Knoten eine Ordnung aus der geometrischen Darstellung allein nicht ablesbar wäre.

Abbildung 2.5: Atomares Netzstück mit zwei Konzeptknoten

Abbildung 2.6: Atomares Netzstück mit vier Konzeptknoten

Unsere Darstellung ist sehr stark geprägt vom Verständnis, das sich ergibt, wenn man semantische Netze als Darstellungen logischer Formeln auffaßt. Nur so erscheint es möglich, aus der Vielfalt der in der Literatur vorhandenen Netzvarianten ein einheitliches Konzept zu extrahieren. Dies führt aber zum Beispiel dazu, daß die verkürzte Netzdarstellung der Abbildung 2.5 unüblich ist. Man hat sich in der Wissensrepräsentation nämlich weitgehend auf die Verwendung zweistelliger Prädikate eingeschworen. Konzeptuell ist das sehr fragwürdig, mag die daraus resultierende Einfachheit auch noch so bestechen.

Aus logischer Sicht macht uns dies jedoch keine Probleme, läßt uns doch die Prädikatenlogik bei der Wahl des Prädikats große Freiheit. Insbesondere können wir hier entweder ist_eine_Stadt (wie geschehen) oder lediglich ist als Prädikat wählen. Im letzteren Fall ergibt sich ist(Nürnberg,Stadt), dessen Diagramm (vgl. Abbildung 2.4) für diesen Fall gebräuchlicher ist.

Die Darstellung eines drei- oder mehrstelligen Prädikats mittels ausschließlich zweistelligen Prädikaten läßt sich auf verschiedenste Weisen bewerkstelligen. Eine simple Lösung besteht darin, zB. das Objekt ``Buch'' in unserem Beispiel mit in das Prädikat zu ziehen, also Gibt_Buch(john,mary). Eine weitere besteht in der Vorstellung einer solchen atomaren Aussage als ein Ereignis , im vorliegenden Fall ein Geben-Ereignis [Nil80], und der Verknüpfung dieses Ereignisses mit den einzelnen Objekten in der Weise Geber(e,john) Nehmer(e,mary) Objekt(e,buch). Eine weitere Möglichkeit besteht in der Einführung von Knoten, die zwei Objekte oder einen neueingeführten Knoten mit einem weiteren Objekt verbinden, wobei sich die Frage nach der Bedeutung der neuen Knoten ergibt, der wir an dieser Stelle nicht mehr nachgehen werden. Spätere Beispiele werden illustrieren, welche Lösungen in der Wissensrepräsentation hierfür heute gebräuchlich sind.

Stellt man die durch das Netz der Abbildung 2.4 repräsentierte prädikatenlogische Aussage Farbe(mein_Auto,rot) als gaG dar wie im vorigen Abschnitt besprochen, so erhält man exakt die gleiche graphische Darstellung wie das Netz in der ausführlichen Fassung. Das Gleiche gilt für die Beispiele der Abbildungen 2.5 und 2.6, ja es gilt ganz allgemein. Mit anderen Worten, assoziative Netze können als die gaG-Darstellungen der entsprechenden logischen Formeln aufgefaßt werden. Im Sinne von Brachman (siehe Abschnitt 1.5.3) ist dies die Sicht auf der logischen Ebene. Diese Aussage läßt sich als eine erneute Bestätigung für die große Tragweite der Prädikatenlogik interpretieren. Sie bestätigt aber auch die Wichtigkeit der gewählten Formelrepräsentation, auf die wir in Abschnitt 2.3 bereits hingewiesen haben und auf die wir in Abschnitt 2.11.13 nochmals zu sprechen kommen.

Nach dieser allgemeinen Feststellung scheint es sich nicht zu lohnen, assoziative Netze noch weiter in allen Einzelheiten zu erörtern, da sich über die nunmehr vorausgesetzte Kenntnis der Prädikatenlogik keine wesentlichen Gesichtspunkte mehr ergeben dürften. Leider ist diese Darstellung zu simplifizierend, um einen allumfassenden Eindruck zu vermitteln. Da uns hierfür der Raum fehlt, wollen wir versuchen, den Eindruck durch die folgende Sammlung von weiteren Anmerkungen abzurunden.

Wie wir für diesen speziellen Fall kurz vorher gesehen haben, wird in der verkürzten Darstellung die Kantenrichtung vom ersten zum zweiten Argument gelegt. In aller Regel findet diese Unsymmetrie ihren Niederschlag in einer dadurch suggerierten Interpretation einer funktionalen Abhängigkeit des zweiten vom ersten Argument. So gibt es im Beispiel der Abbildung 2.3 zu jedem Auto eine Farbe (aber nicht notwendigerweise zu jeder Farbe auch ein Auto). So gesehen entspricht der mit ``Farbe'' markierte Knoten im Netz der Abbildung 2.3 eigentlich einem Funktionszeichen statt des verwendeten Prädikatszeichens. In dieser Lesart stellt die Abbildung 2.3 die Aussage dar; oder, um es datenbanktechnisch auszudrücken, das erste Argument fungiert als ein Schlüssel. In dieser funktionalen Interpretation zweistelliger Prädikate dürfte auch der Grund liegen, warum Terme in semantischen Netzen selten ([Cer75] ist eine der Ausnahmen) explizit dargestellt werden.

Weiter bemerken wir noch einmal explizit, daß unsere Darstellung in einem trivialen Punkt von der Schuberts abweicht, da wir einen geordneten Graphen vorweg vorausgesetzt haben, während Schubert diese Ordnung durch Markierungen (PRED, A, B, C usw.) bewerkstelligt hat.

Es gibt noch einen wichtigeren Unterschied zwischen den gaG-Darstellungen auf der einen Seite und den verkürzten Netzen auf der anderen. Betrachten wir zum Beispiel die Aussage . Sowohl in dieser linearen (eindimensionalen) Darstellung als auch in der gaG-Darstellung ist eine Reihenfolge der beiden Teilaussagen festgelegt (auch dann, wenn man formal die Nachfolgerknotenmenge als ungeordnet betrachtet). Eine solche Reihenfolge ist in der verkürzten Darstellung dagegen nicht bestimmt. Die letztere realisiert daher implizit die Kommutativität der Konjunktion. Darin mag mit ein Grund für das leichtere kognitive Erfassen liegen (denn auch in der Welt sind verschiedene Eigenschaften eines Objekts nicht nach einer ersichtlichen Reihenfolge angeordnet). Im Hinblick auf die Effizienz der Implementierung ist damit noch nichts ausgesagt, da in einer konkreten Datenstruktur für solche Netze dieser Vorteil in aller Regel wieder verloren geht, weil dort meist wieder Eindimensionalität herrscht.

Andererseits wird in der verkürzten Darstellung des Beispiels das Prädikat zweimal repräsentiert (als Markierung zu jeder der beiden Kanten). Dies kann in der gaG-Darstellung in gleicher Weise der Fall sein, darüber hinaus erlaubt die gaG-Darstellung jedoch auch diese Redundanz zu eliminieren und das nur einmal zu repräsentieren, wie es in Abbildung 2.1 geschehen ist.

Wie in Abschnitt 1.5.3 betont, entscheidet über die Qualität eines Formalismus das Komplexitätsverhalten bei der Ausführung der erforderlichen Operationen. Objektnetze aller Art (also natürlich auch Logikformeln in gaG-Darstellung) erlauben einen optimalen Zugriff auf die Objekte und damit auch auf ihre (angehängten) Eigenschaften (zB. mit konstantem Aufwand, dh. , bei Verwendung von ``hashing'' Techniken). Damit ergibt sich auch ein leichtes Einfügen neuer Objekte samt ihrer Eigenschaften in das Netz, da irgendwelche in diesen Eigenschaften vorkommenden Objekte sofort lokalisiert (und konnektiert) werden können. Das Entfernen ist entsprechend noch einfacher. Wegen der (Fast-) Ununterscheidbarkeit von assoziativen Netzen und gaG-Formeln gilt für beide das gleiche Verhalten hinsichtlich logischer Inferenz. Bezüglich des modus ponens werden wir das in Abschnitt 2.6 demonstrieren.

Assoziative Netze haben mannigfache historische Wurzeln, unter anderem in der Gestaltpsychologie. Innerhalb der Intellektik wird die Dissertation von Quillian (vgl. [Qui67]) als der Ausgangspunkt anerkannt. Seine Idee war, mit semantischen Netzen praktisch den Inhalt eines Wörterbuchs zu repräsentieren (vgl. die linguistische Ebene des Abschnitts 1.5.3). So zeigt die Abbildung 2.7 drei solcher ``Wörterbucheinträge''. Die Ovale stellen die Typknoten dar, die übrigen Knoten (engl. tokens) sind über Verweise mit den entsprechenden Typknoten verbunden, wo deren eigentliche Definition gegeben ist. Die volle Bedeutung eines durch einen Typknoten dargestellten Konzeptes ist nach Quillian in der Menge der von ihm aus erreichbaren Knoten dargestellt. Sowohl diese Darstellung als auch eine spätere Variante von Quillian ist durch die Schubertsche Analyse abgedeckt.

Abbildung 2.7: Drei Bedeutungen von ``Band'' laut Duden.

In den Siebziger Jahren hatte man innerhalb einer bestimmten Schule die Hoffnung, daß sich atomare Aussagen mittels einer höheren konzeptuellen Struktur besser verstehen lassen als mit der prädikatenlogisch-syntaktischen. Diese Hoffnung wurde durch die Beobachtung genährt, daß in vielen atomaren Aussagen die Rollen der Prädikate und Argumente untereinander trotz inhaltlicher Unterschiede recht ähnlich sind (vgl. zB. die Aktionsprädikate ``geben'' und ``sagen''). Ein herausragender Vertreter dieser Schule war R. Schank, der bereits in die Struktur atomarer Netzstücke einen stärkeren semantischen Gehalt im Sinne von Abschnitt 2.1 zu verlagern versuchte [Sch72, SR74].

Eine solche konzeptuell als primitiv angesehene Relation ist in Abbildung 2.8 in Schanks eigener Notation zu dem Beispiel aus Abbildung 2.6 (jedoch hier mit fünf Konzeptknoten) dargestellt ( darin steht für Objekt, für Nehmer). Schank spricht von einer Darstellung der konzeptuellen Abhängigkeiten (engl. conceptual dependency representation). Allgemeiner spricht man hier auch von einer Kasusstruktur (engl. case structure). Als Kasus wird dabei der Name einer bestimmten Rolle verstanden, die eine Substantivphrase im Zustand oder in der Aktivität spielt, der oder die durch das Verb eines Satzes ausgedrückt wird (im nächsten Abschnitt werden wir dieser Idee unter dem Namen ``Schlitz'' oder ``slot'' wiederbegegnen). Man spricht bei den zugehörigen Kanten von strukturellen (im Gegensatz zu Aussage-) Kanten. Zum Vergleich einer solchen Struktur mit der bisherigen Netzdarstellung ist das entsprechende atomare Netzstück, zur Verdeutlichung der geometrischen Analogie mit Schuberts Ordnungsmarkierungen, mit angegeben. Der Unterschied erweist sich offensichtlich als syntaktischer Puderzucker.

Abbildung 2.8: Konzeptuelle Abhängigkeiten

Damit sei jedoch nicht in Abrede gestellt, daß in der natürlichen Sprache verschiedene Aussagen mit einer gewissen Ähnlichkeit strukturell ähnlich behandelt werden, wodurch das Sprachverständnis unterstützt werden könnte. Prädikatenlogisch ausgedrückt hieße das, daß gewisse Stelligkeiten bei Prädikaten (evtl. einer bestimmten Klasse) bevorzugt werden und die einzelnen Stellen in stereotyper Weise behandelt werden, so daß schon von der syntaktischen Struktur her eine semantische Interpretation zum Teil dispositioniert ist. Ob es sich dabei wirklich, wie behauptet, um primitive Relationen handelt, sei dahingestellt. Unterstellt man dies, so würde man die Schubertschen Kantenmarkierungen nicht als bloße Ordnungsmarkierungen, sondern als echte relationale Konzepte auffassen, wie es in [Sim73] geschieht. Zum Beispiel hätte man anstelle der Markierung eine prädikative Beziehung Akteur(a,b), dh. (im Beispiel Karl) ist der Akteur in der Aktion , was impliziert, daß belebt und eine Aktion ist. Ähnliches gilt für die weiteren Kanten.

Wir wollen hier über den soeben beschriebenen Ansatz (der in anderem Gewand im folgenden Abschnitt über Konzeptrahmen wieder auftaucht) kein abschließendes Urteil fällen. Wer sich jedoch an die erbitterten Wortgefechte jener Zeit noch erinnert, die auch in der Literatur ihren Niederschlag gefunden haben, wird nunmehr erkennen, daß sie meist an der Sache vorbeigingen, indem sie sich für oder gegen einen bestimmten Formalismus (etwa die Prädikatenlogik) gerichtet haben. Insbesondere mußte man erkennen, daß diese Netze nicht mehr semantischen Gehalt vermitteln, als es die entsprechenden prädikatenlogischen Formeln (in einer bestimmten Repräsentation und gegebenenfalls durch Kasusstrukturen angereichert) tun. Genau aus diesem Grunde ist man heute zur Bezeichnung ``assoziative Netze'' übergegangen.

Einer der wesentlichen Gründe für die Popularität der assoziativen Netze ist zweifelsohne ihre Anschaulichkeit in Verbindung mit einer besonders für die Zwecke der Verarbeitung natürlicher Sprache (dh. die dafür erforderlichen Operationen) geeigneten Datenstruktur. Leider reicht die Anschaulichkeit nur bis zu den bisher illustrierten Beschreibungen. Integriert man den gesamten logischen Apparat, wie es Schubert getan hat, so geht diese Anschaulichkeit sofort verloren. Ein Blick auf die gaGs der Abbildungen 2.1 und 2.2 kann dies bestätigen. Die so dargestellten Formeln sind bei weitem nicht mehr so gut lesbar wie in der logischen Standardnotation. Wie wir oben gesehen haben, sind diese gaGs im wesentlichen identisch mit den entsprechenden assoziativen Netzen. Um diesen Standpunkt jedoch noch explizit zu verdeutlichen, geben wir in Abbildung 2.9 das assoziative Netz von Abbildung 14 aus [Sch76] ohne weitere Erläuterung, nur zur Illustration, wieder, so daß sich der Leser selbst ein Bild von der verbliebenen Anschaulichkeit zu machen vermag.

Abbildung 2.9: als Netz

Für seinen Teil zieht der Autor selbst hieraus den Schluß, daß es nach wie vor besser ist, die logische Standardnotation als allgemeinen Referenzpunkt auf der Ebene des Experten beizubehalten, die assoziativen Netze ausschließlich im Sinne der gaG-Darstellung von logischen Formeln aufzufassen (wodurch insbesondere ihre Semantik mitgeliefert wird) und daher, außer in einfachsten Ausnahmefällen, nur auf der Ebene des Wissensingenieurs in Betracht zu ziehen. Diese klare Trennung von syntaktisch präziser Darstellung als logische Formel und Kompaktierung im Sinne einer effizienten Behandlung erscheint mir überzeugender als die in assoziativen Netzen angestrebte, aber nicht überzeugend gelungene Mischung beider (ja sogar weiterer in Abschnitt 1.5.3 genannter) Ziele. Die konzeptuelle Strukturierung ist dann nochmal etwas von dieser Sprachstruktur Verschiedenes, worauf wir im folgenden Abschnitt weiter eingehen.

Christoph Quix, Thomas List, René Soiron
30. September 1996