Empirical Analysis of Belgian Entrepreneurial Careers via Robust Clustering and Predictive Modelling

Ewoud Heyndels

Research output: ThesisPhD Thesis

37 Downloads (Pure)

Abstract

Dit project start vanuit de eClipzdataset die data bevat over alle Belgische zelfstandigen sinds 1984. De belangrijkste gegevens zijn de inkomens van de zelfstandigen en het statuut waaronder
zij werkten (hoofdberoep, bijberoep, ...). Deze zijn gekend voor elk kwartaal waarin de zelfstandige actief was. In hoofdstuk 2 wordt een factormodel opgesteld dat de tijdreeksen van de
inkomensgroei, en bij uitbreiding alle soorten tijdreeksen kan clusteren in een aantal representatieve groepen. Het aantal groepen en factoren wordt niet opgelegd, maar volgt uit het model
zelf. Het model is robuust tegen uitschieters, wat de representativiteit ten goede komt. Het model is toegepast op een selectie van 12891 hoofdberoepers, die in 3 groepen werden ingedeeld. Post-analyse van de groepen geeft aan dat 1 van de groepen sterk gedreven wordt door Waalse landbouwers. In hoofdstuk 3 wordt de benodigde rekentijd gereduceerd en de code van het model geprofessionaliseerd en publiek toegankelijk gemaakt (publicatie als R-pakket op CRAN).
Verder wordt het belang aangetoond van een goed informatiecriterium om het aantal groepen en factoren correct te schatten bij datasets die niet oneindig groot zijn. Hierbij wordt een nieuw informatiecriterium ge¨ıntroduceerd. In hoofdstuk 4 wordt een model opgesteld om de transities tussen de verschillende mogelijke zelfstandigenstatuten te modelleren. Hierbij wordt uitgegaan van een Dirichlet regressiemodel met tijdsvari¨erende parameters. Dit model modelleert de relatieve proporties van de statuten. Het hangt af van externe variabelen. Door middel van de
Model Confidence Set procedure wordt de combinatie van externe variabelen gekozen die tot de beste korte-termijnvoorspelling van de proporties leidt. De leeftijdsverdeling van zelfstandigen
heeft invloed op de relatieve belangrijkheid van de transities. In hoofdstuk 5 wordt gefocust op de eClipzdataset zelf. Hierbij wordt ingegaan op de structuur van de data en op moeilijkheden
bij het gebruik, bvb. door de niet eenduidige manier van het weergeven van NA’s. Er wordt ook melding gemaakt van mogelijke fouten en de redenen daarvoor en van inconsistenties met andere
bronnen.
Original languageEnglish
QualificationDoctor in Applied Economics
Awarding Institution
  • Vrije Universiteit Brussel
Supervisors/Advisors
  • Boudt, Kris, Supervisor
Award date22 Jun 2023
Publication statusPublished - 2023

Fingerprint

Dive into the research topics of 'Empirical Analysis of Belgian Entrepreneurial Careers via Robust Clustering and Predictive Modelling'. Together they form a unique fingerprint.

Cite this