Rechtvaardigheid in Reinforcement Learning voor Toewijzingsproblemen

Projectdetails

!!Description

Rechtvaardigheid is een centrale zorg geworden voor de
ontwikkeling van geautomatiseerde besluitvormingssystemen in reële
toepassingen. Beslissingen in het kader van toewijzingsproblemen,
zoals leningen verstrekken, vaccins verdelen, hebben een grote
maatschappelijke impact en vereisen zorgvuldige afwegingen van
betrokken individuen en groepen. Bovendien kunnen deze
problemen geleidelijk evolueren. Daarom is het belangrijk om het
langetermijneffect van beslissingen te begrijpen en zich aan te
passen aan mogelijke veranderingen. We zullen rechtvaardigheid
bestuderen in diverse dynamische toewijzingsproblemen met behulp
van reinforcement learning (RL), met directe feedback (i.e., bandit
setting), en anderen waar er een langetermijnimpact is of een
sequentieel aspect.
De hoofdrichting die we voorstellen is het initiële beslissingsprobleem
uit te breiden en rechtvaardigheid te beschouwen als een apart doel,
naast de systeemprestatie. Hiervoor nemen we een multi-objective
RL aanpak om onze overkoepelende doelstelling te bereiken:
rechtvaardige RL-technieken met voorbedachtheid en een
transparanter perspectief op het beslissingsproces. Als validatie,
beschouwen we twee use-cases: epidemische controle en
fraudedetectie. Beiden verschillen in RL aanpak en hebben
betrekking tot complementaire rechtvaardigheidsaspecten, wat een
uitgebreide en diverse empirische evaluatie biedt met inzicht die
overdraagbaar is naar andere toepassingsdomeinen (bijv.
grenscontrole, waterdistributie).
AcroniemFWOSB142
StatusActief
Effectieve start/einddatum1/11/2231/10/26

Keywords

  • Versterkend leren
  • Eerlijkheid door ontwerp
  • Multi-Objectief versterkend leren

Flemish discipline codes in use since 2023

  • Machine learning and decision making
  • Artificial intelligence not elsewhere classified

Vingerafdruk

Verken de onderzoeksgebieden die bij dit project aan de orde zijn gekomen. Deze labels worden gegenereerd op basis van de onderliggende prijzen/beurzen. Samen vormen ze een unieke vingerafdruk.