4.7.6 Planungssysteme (zusammen mit Josef Schneeberger)

Nächste Seite: 4.8 Die inferentielle Behandlung Vorige Seite: 4.7.5 Lineare Logik

4.7.6 Planungssysteme (zusammen mit Josef Schneeberger)

Nachdem wir uns bis jetzt in diesem Abschnitt über Planen auf die deduktive Behandlung von Planungsproblemen konzentriert haben, wollen wir zum Abschluß noch die wichtigsten aus der Literatur bekannten Planungssysteme vorstellen. Grundlage fast aller dieser Systeme ist die Darstellung von Situationen durch Mengen von Fluenten. Diese Sichtweise ist historisch bedingt und basiert auf den Ideen des im Abschnitt 4.7.4 vorgestellten Planungssystems STRIPS. Die in den vorangegangenen Abschnitten diskutierte Darstellung von Situationen durch Multimengen von Fluenten ist erst in den letzten Jahren entwickelt worden und findet sich noch nicht in implementierten Systemen.

Die verschiedenen Planungssysteme lassen sich im wesentlichen in drei Kategorien einteilen, nämlich mengenbasierte, planbasierte und sensorbasierte Planungssysteme. Wir wollen im folgenden diese Kategorien kurz charakterisieren und ihre typischen Vertreter vorstellen. Eine ausführlichere Darstellung der Systeme findet sich in [THD90] und in [BGH+93]

In den mengenbasierten Planungssystemen wird ein Plan als Folge von Situationen betrachtet, wobei jeder Übergang von einer Situation in eine andere durch das Ausführen einer Aktion ermöglicht wird. Aus diesem Grund entspricht die Suche nach einem Plan im Prinzip der Zielsuche im Raum der möglichen Situationen. Ein solches System heißt mengenbasiert, da Situationen eben durch Mengen von Fluenten repräsentiert werden. Wie bereits im Abschnitt 4.7.4 beschrieben, bedeutet das Durchlaufen eines Planes etwa in STRIPS die Veränderung von Situationen durch Löschen bzw. Hinzufügen von Fluenten. In vieler Hinsicht kann STRIPS als das Grundmodell aller nachfolgenden Planungssysteme in der Intellektik angesehen werden. Dies gilt insbesondere für die Darstellungen von Aktionen durch Tripel bestehend aus Vorbedingung und den beiden Mengen der zu löschenden bzw. hinzuzufügenden Fluenten, für die bei der Implementierung von STRIPS verwendeten Techniken und für die Kopplung des reinen Planungsystems mit einer Komponente zur Überwachung der Planausführung. Aufbauend auf den Prinzipien von STRIPS entstanden in der Folge eine Reihe von Planungssystemen, von denen ABSTRIPS [Sac74] und WARPLAN [War74] die vielleicht bekanntesten sind.

In den Planungssystemen der zweiten Kategorie, dh. den planbasierten System, stehen die Pläne im Mittelpunkt. Diese sind ia. nicht vollständig entwickelt, sondern bestehen aus einer partiell geordneten Menge von Aktionen und noch zu lösenden Teilzielen. Die Aufgabe des Planungssystems ist es nun, einen teilweise entwickelten Plan sukzessive durch Hinzufügen von Aktionen und Elementen der Ordnungsrelation so umzuformen, daß der Plan keine unerfüllten Teilziele mehr enthält und tatsächlich die gegebene Ausgangssituation in die Zielsituation überführt. Als typisches Beispiel für dieses Verfahren beobachten wir einen Handwerker beim Aneinanderkleben zweier Werkstücke. Ein solches Szenario läßt sich durch drei Aktionen beschreiben. Zum einen muß Sekundenkleber auf die Werkstücke aufgetragen werden, und zum anderen müssen die Werkstücke zusammengepreßt werden. Weiterhin ist unser Handwerker im öffentlichen Dienst beschäftigt und muß aufgrund von arbeitsschutzrechtlichen Bestimmungen rechtzeitig eine Pause einlegen. Ein möglicher, teilweise entwickelter Plan kann in diesem Ansatz durch die Formel

beschrieben werden, wobei die Ausgangssituation, das Auftragen des Sekundenklebers, das Zusammenpressen der Werkstücke, die arbeitsrechtliche Vorschrift und die Zielsituation bezeichnen. Dabei ist es unerheblich, ob und als Situation oder Aktion aufgefaßt werden. ist eine partielle Ordnungsrelation, die die Aktionen und Teilziele zeitlich anordnet. Im Gegensatz zu den Situationen bzw. Aktionen , , und repräsentiert ein Teilziel, das etwa durch die Aktion Brotzeit_machen erfüllt werden kann.

Ein solcher Plan führt aber noch nicht notwendigerweise dazu, daß die Werkstücke anschließend auch zusammengeklebt sind. Da unser Handwerker Sekundenkleber verwendet, darf er zwischen dem Auftragen des Klebers und dem Zusammenpressen der Werkstücke keine Brotzeit einlegen. Durch Verfeinerung der Ordnungsbeziehungen erhalten wir unter Berücksichtigung dieser Bedingung entweder den Plan

oder den Plan

Wie dieses Beispiel zeigt, muß beim Hinzufügen bzw. Einordnen einer neuen Aktion sichergestellt werden, daß erfüllte Vorbedingungen bereits geplanter Aktionen nicht verletzt werden. Eine formale Definition dieser Bedingung kann hier aus Platzgründen nicht gegeben werden; wir verweisen dazu auf [Cha87]. Durch Berücksichtigung dieser Bedingung können -- im Gegensatz zu mengenbasierten Planungsverfahren -- wechselseitige Abhängigkeiten von Teilplänen frühzeitig während der Planung erkannt und aufgelöst werden. Das erste planbasierte System war NOAH [Sac75]. Aus einer Vielzahl weiterer Systeme, die nach dem gleichen Prinzip arbeiten, sind SIPE [Wil88], TWEAK [Cha87], NONLIN [Tat77] und SNLP [MR91] die bekanntesten Vertreter.

Neben den mengen- und planbasierten Systemen wurden in den letzten Jahren eine Reihe von Methoden entwickelt, die wir hier unter dem Begriff der sensorbasierten oder reaktiven Planungssysteme zusammenfassen wollen. Bei diesen Systemen spielen die Fluenten als semantiktragende Elemente keine Rolle mehr. Vielmehr wird aus der vorliegenden Information aller Sensoren des Akteurs eine nächste Aktion abgeleitet. Ein sensorbasiertes Planungssystem besteht also im Kern aus einer Menge von bedingten Aktionen, die in einer ersten Näherung als Produktionsregeln (siehe Abschnitt 2.9) aufgefaßt werden können. Die bekanntesten Verfahren sind die universellen Pläne von Schoppers [Sch87b, Sch89], das PRS von Georgeff und Lansky [GL87, GLS87], die Systeme PENGI und BLOCKHEAD von Agre und Chapman [AC87, Cha89] und die Aktionsnetze von Nilsson [Nil89]. Sensorbasierte Planungssysteme erzeugen keinen Plan im Sinne einer Folge von Einzelaktionen, sondern sie repräsentieren Handlungswissen über den gesamten Anwendungsbereich. Sie ermöglichen insbesondere, auf unerwartete Änderungen in der realen Welt flexibel und normalerweise ohne Neuplanung reagieren zu können.

Sensorbasierte oder reaktive Planungssysteme werden in der Literatur durchaus kontrovers diskutiert (siehe zB. die grundlegende Kritik an universellen Plänen in [Gin89a]). Die Verwendung von sensorbasierten und klassischen Planungssystemen widerspricht sich jedoch nicht; vielmehr ergänzen und überlappen sich die verschiedenen Systeme. Ein sensorbasiertes Planungssystem kann vorhandene Unsicherheit im Anwendungsbereich und im Definitionsbereich der Aktionen bei der Ausführung eines Plans abfangen, indem jeweils die Aktion als nächste ausgeführt wird, die in der aktuellen Situation unter den aktuellen Zielen angemessen ist. Bemerkt der Akteur jedoch, daß der gegebene bzw. bis dahin erzeugte Plan unzureichend ist, kann er auf die klassische Planung zurückgreifen. Entsprechende Ansätze finden sich beispielsweise in [DR91, TH92]. Letztlich gehen auch diese Arbeiten auf STRIPS -- nämlich auf den Aufbau und die Ausführung der in [FHN72] beschriebenen Dreieckstafeln -- zurück.

In den zurückliegenden Unterabschnitten haben wir uns mit Planungsproblemen beschäftigt, Methoden vorgestellt, mit deren Hilfe Pläne aufgestellt werden können, und typische Fragestellungen, die bei der Behandlung von Situationen, Aktionen und Kausalität auftreten, betrachtet. Planen hat stets auch etwas mit Zeit -- genauer gesagt, mit Zeit und Raum -- zu tun, auch wenn dies in diesem Abschnitt immer nur implizit der Fall war. Beispielsweise sind die Klebeflächen der oben betrachteten Werkstücke zwei- oder dreidimensional, und natürlich muß der Kleber vor dem Zusammenpressen der Werkstücke aufgetragen werden, wenn diese danach auch zusammenhaften sollen. In vielen Fällen ist es notwendig, die Zeit und den Raum auch explizit zu behandeln. Würde in unserem Klebebeispiel der Handwerker normalen Kleber verwenden, dann sollte er beispielsweise mindestens 10, aber nicht mehr als 15 Minuten warten, bevor er die Werkstücke zusammenpreßt. Außerdem muß er natürlich die Klebeflächen vollständig und gleichmäßig mit Kleber bestreichen. Mit der Darstellung und der Manipulation von Zeit und Raum werden wir uns im anschließenden Abschnitt beschäftigen.

Christoph Quix, Thomas List, René Soiron
30. September 1996