Reinforcement Learning in Multi-Doel Multi-Agent Systemen

Projectdetails

!!Description

Vele scenarios in de echte wereld omvatten meerdere agenten in
dezelfde ruimte. Multi-agent systemen zijn een krachtig instrument
voor onderzoekers om dergelijke omgevingen te bestuderen. Huidige
onderzoek neemt meestal aan dat agenten optimaliseren voor één
doel. Dit is echter vaak niet het geval, omdat veel scenario's inherent
meerdere doelen hebben. Bijvoorbeeld, een logistieke dienstverlener
heeft de (mogelijks tegenstrijdige) doelstellingen om alle goederen zo
snel mogelijk af te leveren, tegen zo laag mogelijke kosten en de
uitstoot zo laag mogelijk te houden om het milieu te sparen.
In dit voorstel combineren we speltheorie en reinforcement learning
om de state-of-the-art in multi-doel multi-agent systemen (MDMAS)
te verbeteren. We richten ons op drie hoofddoelen. Eerst ontwikkelen
we de fundamenten vanuit een speltheoretisch perspectief door te
beschrijven onder welke voorwaarden agenten verschillende
oplossingen kunnen bereiken. Vervolgens ontwikkelen we nieuwe
algoritmen voor agenten in MDMAS met eindige actie- en
toestandsruimten. In de laatste doelstelling kijken we naar
complexere systemen. In systemen met hoog-dimensionale en
oneindige actie- en toestandsruimten onderzoeken we twee
bijkomende instrumenten voor agenten om efficiënt te leren. De
eerste methode die we beschouwen is het modelleren van anderen,
waarbij agenten een model construeren van andere agenten. Als
laatste introduceren we communicatie, zodat agenten sneller de
nodige kennis ontvangen.
AcroniemFWOTM1082
StatusGeëindigd
Effectieve start/einddatum1/11/2131/10/23

Keywords

  • Multi-Agent Versterking Leren
  • Speltheorie
  • Multi-Objectieve Optimalisatie

Flemish discipline codes in use since 2023

  • Other computer engineering, information technology and mathematical engineering not elsewhere classified

Vingerafdruk

Verken de onderzoeksgebieden die bij dit project aan de orde zijn gekomen. Deze labels worden gegenereerd op basis van de onderliggende prijzen/beurzen. Samen vormen ze een unieke vingerafdruk.