DUST: Het ontwerpen van interpreteerbare en efficiënte Deep Unfolding Sparse Transformers voor multimodale beeldverwerking en beeldgeneratie

Projectdetails

!!Description

Deep learning behaalt geweldige resultaten in een waaier aan taken
in signaal- en beeldverwerking. Door recente ontwikkelingen in
autonome wagens, robotica en andere slimme apparatuur is er een
groeiende vraag naar compacte en efficiënte deep learning modellen
die ook interpreteerbaar zijn en waarvan de beslissingen duidelijk
kunnen worden uitgelegd aan mensen. De Transformer architectuur
wint de laatste tijd aan populariteit in het computer vision domein,
met verbetering van de state-of-the-art in vele taken. Ondertussen
vereisen deze modellen nog altijd zeer veel rekenkracht om te
trainen en te gebruiken, wat hun adoptie in minder krachtige
apparaten zoals robots en slimme camera's verhindert. Deze kosten
groeien verder explosief voor multimodale data. Het DUST project
stelt daarom de ontwikkeling voor van een nieuwe klasse van
efficiënte en interpreteerbare Transformers, gebaseerd op sparsity en
het deep unfolding framework. Deze modellen zullen state-of-the-art
prestaties leveren voor multimodale visuele toepassingen,
bijvoorbeeld het detecteren van objecten of anomalieën. Ten tweede
zullen de modellen uitgebreid worden tot GANs voor geleide superresolutie en beeldfusie van bv. RGB en diepte of infrarood. Verder zal
DUST nieuwe uitleg- en interpretatiemethoden ontwikkelen voor deze
Transformers, en ook inzicht zoeken in de generatieve processen
van Transformer GANs, wat nog niet uitgebreid is bestudeerd
AcroniemFWOSB140
StatusActief
Effectieve start/einddatum1/11/2231/10/26

Keywords

  • Multimodale visietransformatoren
  • Verklaarbare/interpreteerbare AI
  • Diep uitgevouwen schaarse codering

Flemish discipline codes in use since 2023

  • Machine learning and decision making
  • Computer vision
  • Multimedia processing not elsewhere classified
  • Image processing

Vingerafdruk

Verken de onderzoeksgebieden die bij dit project aan de orde zijn gekomen. Deze labels worden gegenereerd op basis van de onderliggende prijzen/beurzen. Samen vormen ze een unieke vingerafdruk.