|
|||||||||||||||||||||||||||||||||
| ISBN: 3860635484 ISBN: 3860635484 ISBN: 3860635484 ISBN: 3860635484 | |||||||||||||||||||||||||||||||||
|
Wir empfehlen: | ||||||||||||||||||||||||||||||||
3 Verwirklichungen im Roboterfußball3.1 Eigenschaften der Umgebung des Roboterfußballs in der MiroSot-LigaUm die im Hauptteil dieses Papiers kennengelernten Aspekte von Multiagentensystemen auf den Roboterfußball übertragen zu können, müssen zunächst die Eigenschaften betrachtet werden, die diese spezielle Umgebung hat. Hier wird der Spezialfall des Roboterfußballs mit drei echten Robotern pro Team betrachtet, was den Vorgaben der MiroSot-Liga (einer speziell für Roboter eingeführten Fußball-Liga) entspricht. Zunächst gibt es also, wie bereits gesagt, ein Team aus drei Agenten, die ein gemeinsames Ziel verfolgen. Man hat es also mit Kooperation (cooperation, als Spezialfall von Koordination) zu tun. Außerdem gibt es aber auch ein gegnerisches Team aus drei Agenten, die ein gegensätzliches Ziel verfolgen. Der zweite Spezialfall der Koordination, die Konkurrenz (competition), spielt hier also auch eine Rolle. Die Sensorik, d.h. die Möglichkeiten, die Welt zu erkennen, und die Aktuatoren, d.h. die Möglichkeiten, die Welt zu verändern, sind bei den Robotern ungenau. Die Sensorik stützt sich in dieser Liga vorwiegend auf die Bilder, die von einer über dem Spielfeld angebrachten Videokamera übertragenen werden. Die Bilderkennung ist also wesentlich, aber ein sehr schweres Problem und deswegen nicht perfekt. Auch die Kontrolle der Motoren der Roboter ist nicht perfekt. Es kann leicht vorkommen, daß ein Roboter leicht um die Kurve fährt, obwohl er eigentlich geradeaus fahren sollte, weil zum Beispiel ein Rad ab und zu durchdreht. Sensorik und Motorik sind also noisy. Die Umgebung ist kein abgeschlossenes System. Sie kann sich also ständig ohne Einflußnahme eines der Agenten verändern. Im Gegensatz zu den meisten Umgebungen der klassischen KI ist diese Welt also nicht statisch (= nur von den Aktionen des Agenten abhängig) sondern dynamisch. Dies ist nicht nur auf die nicht komplett erreichbare Abgeschlossenheit des Systems Spielfeld von äußeren Einflüssen (wie zum Beispiel der Beleuchtung) zurückzuführen, sondern auch auf das gegnerische Team, dessen Aktionen nicht (genau) im Voraus berechnet werden können. Durch die Spielsituation, in der jede Sekunde zählt, da der Gegner auch schnell handelt, darf auch nicht zu lange geplant oder verhandelt werden, bevor eine Aktion ausgeführt wird. Es ist also nötig, möglichst schnell auf eine sich ändernde Umgebung reagieren zu können. Planen, Kommunikation und Lernen müssen also auf dies Bedürfnis nach real-time Aktionen ausgelegt sein. Peter Stone hat in seiner Dissertation [14] die Umgebung des simulierten Roboterfußballs durch PTS-Domains charakterisiert. PTS bedeutet periodic team synchronisation. Die Umgebung des Roboterfußballs (auch die mit echten Robotern) ist nämlich auch durch periodische Unterbrechungen des Spiels gekennzeichnet, in denen kein aktueller Handlungsbedarf besteht. Es gibt also solche Intervalle, in denen das Team Zeit zur Synchronisation, das heißt Zeit zu vermehrter Kommunikation zum Zwecke des gegenseitigen Austauschs von gelerntem Wissen oder zum Entwickeln und Festlegen einer gemeinsamen langfristigen Strategie. 3.2 Ein Beispiel für Kooperation im Roboterfußball: Team Member Agent ArchitectureDie Team Member Agent Architecture aus [14] ist ein Beispiel, wie die Zusammenarbeit von Agenten im Roboterfußball geregelt werden kann. Sie lehnt sich recht stark an den menschlichen Fußball an und nutzt die Eigenschaften der im letzten Kapitel angesprochenen PTS-Domain aus. Zunächst muß die Architektur der einzelnen Agenten betrachtet werden.
3.3 Ein Beispiel für Lernen im Roboterfußball: Layered LearningEin Beispiel für maschinelles Lernen im Roboterfußball ist das auch von Peter Stone in [14] eingeführte Layered Learning. Dabei werden die zu lösenden Probleme mit einem bottom-up-Ansatz in mehrere Verhaltensschichten aufgeteilt, um dann die in diesen Schichten auftretenden Teilprobleme jeweils einzeln mit maschinellen Lernverfahren zu lösen. Diese Aufteilung in Verhaltensschichten ist nicht vorgeschrieben, sondern wird durch die in der speziellen Umgebung gegebenen Möglichkeiten zu maschinellem Lernen bestimmt. Eine Möglichkeit der Aufteilung für die Umgebung des Roboterfußballs ist in Abbildung 12 dargestellt.
|
|
||||||||||||||||||||||||||||||||
![]() | |||||||||||||||||||||||||||||||||
| |<< First < Previous Index Next > Last >>| | |||||||||||||||||||||||||||||||||
|
Back to the topic sites: ScientificPublication.com/Startseite/Wissenschaft StudyPaper.com/Startseite/Computer/Informatik External Links to this site are permitted without prior consent. | |||||||||||||||||||||||||||||||||
| Home | deutsch | Set bookmark | Send a friend a link | Copyright © | Impressum | |||||||||||||||||||||||||||||||||