Het Parallellizeren van Kleinste Kwadraten Methoden onder de Multisplitting Theorie

Projectdetails

!!Description

In onze moderne samenleving worden we overstelpt met digitale informatie en data. De analyse hiervan biedt inzichten voor zowel de industriële als voor de wetenschappelijke wereld. Een belangrijke uitdaging hierin is het ontwikkelen van nieuwe verwerkingstechnieken voor hoog dimensionale statistische problemen die te complex zijn om met huidige technieken binnen een respectabele tijd te verwerken.

We leggen onze focus op de regressie analyse, waarbij het enorme aanbod aan observaties ons toelaat ook de kleinste effecten statistisch significant mee te modelleren. Met als gevolg dat het aantal variabelen in het model drastisch toeneemt. Aangezien de exacte oplossing van het kleinste-kwadraten probleem kwadratisch toeneemt met het aantal variabelen en lineair stijgt met het aantal observaties, zijn klassieke seriële implementaties numeriek ontoereikend voor hoog dimensionale regressie problemen.

De wetenschappelijke wereld heeft deze uitdaging reeds erkend en heeft verschillende parallelle implementaties aangeboden voor het kleinste-kwadraten probleem. Terwijl een groot deel van deze technieken zich berust op de parallellisatie van een bestaand algoritme (code-wise parallellisation), splitst de Multisplitting techniek het origineel regressie probleem in verschillende kleinere regressie problemen, wat een lineaire versnelling geeft t.o.v. de andere technieken. Wij zullen de Multisplitting techniek verder versnellen door gebruik te maken van de onderliggende structuur van een gegeven regressie opstelling. Verder zullen we de gevoeligheid voor numerieke fouten van deze techniek doorheen het algoritme analyseren. Ten slotte zullen we de Multisplitting techniek uitbreiden naar andere regressie gebaseerde problemen. Dit zal samen bijdragen tot een scala aan hoog dimensionale kleinste-kwadraten toepassingen, gaande van het verwerken van medische beelden in de signaalverwerking tot reguleringstechnieken in de Machine Learning.
AcroniemFWOTM853
StatusGeëindigd
Effectieve start/einddatum1/10/1730/09/21

Flemish discipline codes in use since 2023

  • General mathematics

Vingerafdruk

Verken de onderzoeksgebieden die bij dit project aan de orde zijn gekomen. Deze labels worden gegenereerd op basis van de onderliggende prijzen/beurzen. Samen vormen ze een unieke vingerafdruk.