Abstract
Dit project start vanuit de eClipzdataset die data bevat over alle Belgische zelfstandigen sinds 1984. De belangrijkste gegevens zijn de inkomens van de zelfstandigen en het statuut waaronder
zij werkten (hoofdberoep, bijberoep, ...). Deze zijn gekend voor elk kwartaal waarin de zelfstandige actief was. In hoofdstuk 2 wordt een factormodel opgesteld dat de tijdreeksen van de
inkomensgroei, en bij uitbreiding alle soorten tijdreeksen kan clusteren in een aantal representatieve groepen. Het aantal groepen en factoren wordt niet opgelegd, maar volgt uit het model
zelf. Het model is robuust tegen uitschieters, wat de representativiteit ten goede komt. Het model is toegepast op een selectie van 12891 hoofdberoepers, die in 3 groepen werden ingedeeld. Post-analyse van de groepen geeft aan dat 1 van de groepen sterk gedreven wordt door Waalse landbouwers. In hoofdstuk 3 wordt de benodigde rekentijd gereduceerd en de code van het model geprofessionaliseerd en publiek toegankelijk gemaakt (publicatie als R-pakket op CRAN).
Verder wordt het belang aangetoond van een goed informatiecriterium om het aantal groepen en factoren correct te schatten bij datasets die niet oneindig groot zijn. Hierbij wordt een nieuw informatiecriterium ge¨ıntroduceerd. In hoofdstuk 4 wordt een model opgesteld om de transities tussen de verschillende mogelijke zelfstandigenstatuten te modelleren. Hierbij wordt uitgegaan van een Dirichlet regressiemodel met tijdsvari¨erende parameters. Dit model modelleert de relatieve proporties van de statuten. Het hangt af van externe variabelen. Door middel van de
Model Confidence Set procedure wordt de combinatie van externe variabelen gekozen die tot de beste korte-termijnvoorspelling van de proporties leidt. De leeftijdsverdeling van zelfstandigen
heeft invloed op de relatieve belangrijkheid van de transities. In hoofdstuk 5 wordt gefocust op de eClipzdataset zelf. Hierbij wordt ingegaan op de structuur van de data en op moeilijkheden
bij het gebruik, bvb. door de niet eenduidige manier van het weergeven van NA’s. Er wordt ook melding gemaakt van mogelijke fouten en de redenen daarvoor en van inconsistenties met andere
bronnen.
zij werkten (hoofdberoep, bijberoep, ...). Deze zijn gekend voor elk kwartaal waarin de zelfstandige actief was. In hoofdstuk 2 wordt een factormodel opgesteld dat de tijdreeksen van de
inkomensgroei, en bij uitbreiding alle soorten tijdreeksen kan clusteren in een aantal representatieve groepen. Het aantal groepen en factoren wordt niet opgelegd, maar volgt uit het model
zelf. Het model is robuust tegen uitschieters, wat de representativiteit ten goede komt. Het model is toegepast op een selectie van 12891 hoofdberoepers, die in 3 groepen werden ingedeeld. Post-analyse van de groepen geeft aan dat 1 van de groepen sterk gedreven wordt door Waalse landbouwers. In hoofdstuk 3 wordt de benodigde rekentijd gereduceerd en de code van het model geprofessionaliseerd en publiek toegankelijk gemaakt (publicatie als R-pakket op CRAN).
Verder wordt het belang aangetoond van een goed informatiecriterium om het aantal groepen en factoren correct te schatten bij datasets die niet oneindig groot zijn. Hierbij wordt een nieuw informatiecriterium ge¨ıntroduceerd. In hoofdstuk 4 wordt een model opgesteld om de transities tussen de verschillende mogelijke zelfstandigenstatuten te modelleren. Hierbij wordt uitgegaan van een Dirichlet regressiemodel met tijdsvari¨erende parameters. Dit model modelleert de relatieve proporties van de statuten. Het hangt af van externe variabelen. Door middel van de
Model Confidence Set procedure wordt de combinatie van externe variabelen gekozen die tot de beste korte-termijnvoorspelling van de proporties leidt. De leeftijdsverdeling van zelfstandigen
heeft invloed op de relatieve belangrijkheid van de transities. In hoofdstuk 5 wordt gefocust op de eClipzdataset zelf. Hierbij wordt ingegaan op de structuur van de data en op moeilijkheden
bij het gebruik, bvb. door de niet eenduidige manier van het weergeven van NA’s. Er wordt ook melding gemaakt van mogelijke fouten en de redenen daarvoor en van inconsistenties met andere
bronnen.
Original language | English |
---|---|
Qualification | Doctor in Applied Economics |
Awarding Institution |
|
Supervisors/Advisors |
|
Award date | 22 Jun 2023 |
Publication status | Published - 2023 |