Title:

Eine Einführung in Multiagentensysteme und deren Verwirklichung im Roboterfußball.

Home
deutsch
  
ISBN: 3486247875   ISBN: 3486247875   ISBN: 3486247875   ISBN: 3486247875 
 
|<< First     < Previous     Index     Next >     Last >>|
  Wir empfehlen:       
 

3 Verwirklichungen im Roboterfußball

3.1 Eigenschaften der Umgebung des Roboterfußballs in der MiroSot-Liga

Um die im Hauptteil dieses Papiers kennengelernten Aspekte von Multiagentensystemen auf den Roboterfußball übertragen zu können, müssen zunächst die Eigenschaften betrachtet werden, die diese spezielle Umgebung hat. Hier wird der Spezialfall des Roboterfußballs mit drei echten Robotern pro Team betrachtet, was den Vorgaben der MiroSot-Liga (einer speziell für Roboter eingeführten Fußball-Liga) entspricht.

Zunächst gibt es also, wie bereits gesagt, ein Team aus drei Agenten, die ein gemeinsames Ziel verfolgen. Man hat es also mit Kooperation (cooperation, als Spezialfall von Koordination) zu tun.

Außerdem gibt es aber auch ein gegnerisches Team aus drei Agenten, die ein gegensätzliches Ziel verfolgen. Der zweite Spezialfall der Koordination, die Konkurrenz (competition), spielt hier also auch eine Rolle.

Die Sensorik, d.h. die Möglichkeiten, die Welt zu erkennen, und die Aktuatoren, d.h. die Möglichkeiten, die Welt zu verändern, sind bei den Robotern ungenau. Die Sensorik stützt sich in dieser Liga vorwiegend auf die Bilder, die von einer über dem Spielfeld angebrachten Videokamera übertragenen werden. Die Bilderkennung ist also wesentlich, aber ein sehr schweres Problem und deswegen nicht perfekt. Auch die Kontrolle der Motoren der Roboter ist nicht perfekt. Es kann leicht vorkommen, daß ein Roboter leicht um die Kurve fährt, obwohl er eigentlich geradeaus fahren sollte, weil zum Beispiel ein Rad ab und zu durchdreht. Sensorik und Motorik sind also noisy.

Die Umgebung ist kein abgeschlossenes System. Sie kann sich also ständig ohne Einflußnahme eines der Agenten verändern. Im Gegensatz zu den meisten Umgebungen der klassischen KI ist diese Welt also nicht statisch (= nur von den Aktionen des Agenten abhängig) sondern dynamisch. Dies ist nicht nur auf die nicht komplett erreichbare Abgeschlossenheit des Systems Spielfeld von äußeren Einflüssen (wie zum Beispiel der Beleuchtung) zurückzuführen, sondern auch auf das gegnerische Team, dessen Aktionen nicht (genau) im Voraus berechnet werden können.

Durch die Spielsituation, in der jede Sekunde zählt, da der Gegner auch schnell handelt, darf auch nicht zu lange geplant oder verhandelt werden, bevor eine Aktion ausgeführt wird. Es ist also nötig, möglichst schnell auf eine sich ändernde Umgebung reagieren zu können. Planen, Kommunikation und Lernen müssen also auf dies Bedürfnis nach real-time Aktionen ausgelegt sein.

Peter Stone hat in seiner Dissertation [14] die Umgebung des simulierten Roboterfußballs durch PTS-Domains charakterisiert. PTS bedeutet periodic team synchronisation. Die Umgebung des Roboterfußballs (auch die mit echten Robotern) ist nämlich auch durch periodische Unterbrechungen des Spiels gekennzeichnet, in denen kein aktueller Handlungsbedarf besteht. Es gibt also solche Intervalle, in denen das Team Zeit zur Synchronisation, das heißt Zeit zu vermehrter Kommunikation zum Zwecke des gegenseitigen Austauschs von gelerntem Wissen oder zum Entwickeln und Festlegen einer gemeinsamen langfristigen Strategie.

3.2 Ein Beispiel für Kooperation im Roboterfußball: Team Member Agent Architecture

Die Team Member Agent Architecture aus [14] ist ein Beispiel, wie die Zusammenarbeit von Agenten im Roboterfußball geregelt werden kann. Sie lehnt sich recht stark an den menschlichen Fußball an und nutzt die Eigenschaften der im letzten Kapitel angesprochenen PTS-Domain aus.

Zunächst muß die Architektur der einzelnen Agenten betrachtet werden.


Abbildung 10: Modell eines Agenten (nach [14])

Die Agenten sind deliberativ. Das externe Verhalten wirkt sich direkt auf die Umwelt aus, während das interne Verhalten nur den internen Status beeinflußt. Beide sind von der aktuellen Weltsicht (World State) abhängig, aber das interne Verhalten wird auch von dem sogenannten Locker-Room-Agreement beeinflußt. Dies Locker-Room-Agreement ist eine Abmachung zwischen den Teammitgliedern, die in den spielfreien Perioden festgesetzt wird. Sie enthält die Rollen, die ein Roboter annehmen kann, also z.B. Torwart, und die damit verbundenen Verhaltensvorschriften. Sie enthält weiterhin sogenannte Formationen, die bestimmte Aufgabenverteilungen darstellen und durch eine Multimenge der Rollen mit so vielen Elementen wie es Teammitglieder gibt formalisiert sind. Dabei werden aber noch nicht jedem Teammitglied eine bestimmte Rolle zugewiesen, sondern nur festgelegt, welche Rollen unter den Spielern zu verteilen sind. Die Abbildung der Rollen auf die Agenten können jederzeit während des Spiel verändert werden und ebenso kann jederzeit zu einer anderen in dem Locker-Room-Agreement definierten Formation gewechselt werden. Diese Wechsel sind in Abbildung 11 dargestellt.


Abbildung 11: Rollen und Formationen (nach [14])

Außerdem gibt es noch sogenannte Set-Plays. Das sind im Locker-Room-Agreement festgelegte mehrstufige und mehrere Agenten einbeziehende Pläne, die für bestimmte, oft wiederkehrende Situationen sinnvoll sind.

3.3 Ein Beispiel für Lernen im Roboterfußball: Layered Learning

Ein Beispiel für maschinelles Lernen im Roboterfußball ist das auch von Peter Stone in [14] eingeführte Layered Learning. Dabei werden die zu lösenden Probleme mit einem bottom-up-Ansatz in mehrere Verhaltensschichten aufgeteilt, um dann die in diesen Schichten auftretenden Teilprobleme jeweils einzeln mit maschinellen Lernverfahren zu lösen. Diese Aufteilung in Verhaltensschichten ist nicht vorgeschrieben, sondern wird durch die in der speziellen Umgebung gegebenen Möglichkeiten zu maschinellem Lernen bestimmt. Eine Möglichkeit der Aufteilung für die Umgebung des Roboterfußballs ist in Abbildung 12 dargestellt.


Abbildung 12: Mögliche Verhaltensschichten im Roboterfußball (nach [14])

Tabelle 1 gibt zu dieser Aufteilung der Schichten die entsprechenden Verhaltenstypen und –beispiele an, und Tabelle 2 stellt die in dem [14] zugrunde liegenden Team tatsächlich implementierten Schichten mit den verwendeten Lernverfahren dar. Dabei wird auch zwischen on-line- und off-line-Lernen unterschieden, wobei das erste während des Spiels geschieht und das zweite nur in der Vorbereitung stattfindet.


Tabelle 1: Mögliche Schichten (nach [14])




Tabelle 2: Implementierte Schichten (nach [14])



  
Objektorientierte Softwareentwicklung (Gebundene Ausgabe)
von Bernd Oestereich
Siehe auch:
Die UML-Kurzreferenz 2.3 für die Praxis: kur...
Lehrbuch der Objektmodellierung: Analyse und En...
UML 2 glasklar. Praxiswissen für die...
Die UML-Kurzreferenz für die Praxis
UML 2.0 kurz und gut
Entwurfsmuster
von Kopf bis Fuß
 
   
 
     
|<< First     < Previous     Index     Next >     Last >>| 

Back to the topic sites:
ScientificPublication.com/Startseite/Wissenschaft
StudyPaper.com/Startseite/Computer/Informatik

External Links to this site are permitted without prior consent.
   
  Home  |  deutsch  |  Set bookmark  |  Send a friend a link  |  Copyright ©  |  Impressum