Loonaangifte is cruciaal in de CBS-keuken
Nieuwsbericht | 20-04-2017 | 09:30
Mede-eigenaar én afnemer, dat is de rol en positie van het CBS in de loonaangifteketen. Tot 2006 enquêteerde het statistiekbureau nog bedrijven en instellingen om met de resultaten statistieken te maken over de arbeidsmarkt. Vaak maakte het CBS daarbij al gebruik van de loonadministraties van bedrijven. Het zelf verzamelen van gegevens is nu in de meeste gevallen niet meer nodig. Het CBS kan de data uit de loonaangiftes van bedrijven en instellingen namelijk bijna geheel automatisch verwerken tot belangrijke cijfers over de Nederlandse arbeidsmarkt. Hoe dit in zijn werk gaat blijkt uit een blik in de CBS-keuken.
Van Polisadministratie naar betrouwbare cijfers over de arbeidsmarkt
Via een beveiligde digitale route ontvangt het CBS wekelijks miljoenen records uit de Polisadministratie van UWV. In de Polisadministratie worden alle loonaangiftegegevens verzameld. Deze records zijn voor het CBS ruw basismateriaal dat moet worden opgeschoond en gefilterd. Uiteindelijk wordt het basismateriaal verwerkt tot gegevens die gebruikt worden voor het maken van maandelijkse arbeidsmarktcijfers. Dit hele stapsgewijze verwerkingsproces verloopt voor het grootste deel geautomatiseerd, binnen twee weken. Hoe gaat dat precies in z’n werk? Hoe verwerk je in zo’n korte tijd miljoenen records met een honderdtal kenmerken tot betrouwbare cijfers over de arbeidsmarkt?
Van miljoenen records naar betrouwbare arbeidsmarktinformatie
Bekijk hoe het CBS het ruwe basismateriaal uit de Polisadministratie gebruikt om in korte tijd betrouwbare cijfers over de arbeidsmarkt te publiceren.
-
Stapsgewijs van miljoenen records naar betrouwbare arbeidsmarktinformatie
-
De miljoenen records gaan niet alleen over werk, maar ook over pensioenen en uitkeringen. Als eerste filteren we op de records van werknemers: de banen. Daarvoor toetsen we de opgaven in de Polisadministratie volgens gangbare internationale definities op vier kenmerken:
1. het loon is positief
2. er is meer dan één uur per week gewerkt
3. het gaat om een tegenwoordige dienstbetrekking en
4. de opgave is getypeerd als een soort baan.
Uitkeringen en pensioenen worden uitgesloten
Door deze afbakening sluiten we uitkeringen en pensioenen uit. Het CBS gebruikt die informatie wel, maar in andere processen. Ook opgaven die in eerste instantie over een baan lijken te gaan kunnen komen te vervallen. Bijvoorbeeld bij nabetalingen van dienstbetrekkingen die niet meer bestaan.Wanneer opgaven deels aan de vier baankenmerken voldoen
Tussen de opgaven die slechts deels aan de vier baankenmerken voldoen, kunnen toch echte banen zitten. Denk aan werknemers die in stukloon worden uitbetaald. Hun opgaven bevatten geen uren en worden daarom niet direct als baan getypeerd. In deze en vergelijkbare gevallen vallen we terug op enkele statistische methodes waardoor we de ontbrekende gegevens aan kunnen vullen en de opgaven alsnog als baan aangemerkt worden. Bij stukloonopgaven voegen we dan een bijbehorend aantal uren toe. Die zijn in te schatten op basis van het loon en nadat we eerst een uurloon hebben bepaald. Dat laatste doen we met behulp van andere gegevens in de opgave. Of wanneer nodig met gegevens in eerdere of vergelijkbare opgaven. -
De Polisadministratie is een betrouwbare bron: de gegevens zijn van goede kwaliteit. Toch zitten er soms vreemde eendjes tussen. Die herkennen we aan gegevens die niet plausibel zijn. Herkennen en corrigeren is dan het devies. Dat gebeurt via standaard methodes in het verwerkingsproces. Een paar voorbeelden maken helder hoe dit in de praktijk gaat.
Voorbeeld: het kenmerk van een baan is niet plausibel
Het kan voorkomen dat een baan al maanden achter elkaar het kenmerk van een nabetaling heeft. Of dat het in de ene maand om een nabetaling gaat, terwijl het in de volgende maand gewoon een reguliere baan is. In deze gevallen is het kenmerk ‘nabetaling’ niet plausibel. Waarschijnlijk gaat het elke maand om een reguliere baan. Ook kan het voorkomen dat het reguliere loon opeens flink stijgt, terwijl de overige gegevens in de opgave constant blijven. Het kan dan zijn dat er vergeten is het extra loon op te geven als bijzondere beloning.Voorbeeld: bijschatten omdat niet alle gegevens bekend zijn
Op het moment dat het verwerkingsproces voor een specifieke periode start, zijn nog niet alle loonaangiftes over die periode binnen. Dit is bijvoorbeeld het geval als een werkgever slechts een keer per jaar loonaangifte doet. Of als het verwerkingsproces start voordat de termijn van aangifte doen verstreken is. Dat is eens per kwartaal het geval als het CBS snel kwartaalcijfers wil samenstellen. In dit soort gevallen schatten we ontbrekende opgaven bij, zodat we ze toch kunnen meenemen als banen in een bepaalde maand. Dit bijschatten gebeurt op basis van opgaven in eerdere maanden. Daarbij houden we wel rekening met seizoensontwikkelingen. In de zomermaanden piekt het aantal banen bijvoorbeeld in de horeca en de agrarische sector. Ook houden we rekening met faillissementen, waarbij we geen ontbrekende opgaven bijschatten. -
De loonaangifte bevat niet alle gegevens die we nodig hebben om de statistieken over de arbeidsmarkt te maken. Een aantal daarvan kunnen we echter wel afleiden uit de gegevens in de Polisadministratie. De eerder genoemde bepaling van het uurloon is daar een voorbeeld van. Zo leiden we op basis van het overwerkloon ook de overwerkuren af. Heel belangrijk is ook de berekening in elke opgave van het standaardloon en de standaard uren per maand, exclusief de variabele componenten van het loon en de uren. Dankzij gegevens over contracturen en contractlonen in de loonaangifte vanaf 2016 kunnen we dit veel beter afleiden.
Aanvullende bronnen: het Handelsregister en cao-gegevens
Het CBS verzamelt naast gegevens uit de Polisadministratie nog veel meer informatie om statistieken te maken. Voor de arbeidsmarktstatistieken is bijvoorbeeld het nieuwe Handelsregister van de Kamer van Koophandel een aanvullende bron. Hieruit wordt CBS-breed de Standaard Bedrijfsindeling (SBI) afgeleid. Deze deelt bedrijfsactiviteiten in volgens internationale definities. Zo verrijken we de loonaangiftegegevens met bedrijfstakinformatie van bedrijven en instellingen. Een ander voorbeeld is de verzameling cao-gegevens die informatie biedt over het aantal voltijduren. Door de gegevens uit de Polisadministratie hiermee te verrijken, kunnen we per opgave de deeltijdfactor van de baan afleiden. -
De meeste werkgevers doen per maand of per vier weken loonaangifte. Halfjaarlijkse of jaarlijkse aangiften zijn in de minderheid. Om de statistieken over de arbeidsmarkt, die over maanden of veelvouden daarvan gaan, te kunnen maken, verwerken we alle gegevens tot een maandsituatie. Voor maandelijkse opgaven hoeft dan niets te gebeuren. Maar voor de andere opgaven berekenen we welk gedeelte van de opgave voor welke maand geldt. Een vierwekelijkse aangifte valt bijvoorbeeld meestal in twee maanden. Als dat het geval is splitsten we de opgaven in twee delen, waarbij we de gegevens naar rato verdelen. Dit betekent bijvoorbeeld dat als er drie weken in de ene maand vallen en één week in de volgende maand, we driekwart van het loon aan de ene maand toerekenen en een kwart aan de volgende maand.
-
Het beschreven verwerkingsproces is vrijwel geheel geautomatiseerd. Toch is het altijd nodig om de uitkomsten ook handmatig te controleren. Zijn de uitkomsten plausibel? Dat is de vraag die bij die controle centraal staat. Uiteraard is het niet haalbaar om miljoenen opgaven letterlijk handmatig te checken. We hebben daarvoor een hulpmiddel: een speciaal ontwikkelde applicatie waarmee we heel eenvoudig de ontwikkeling van banen en lonen over de jaren heen per bedrijfstak zichtbaar kunnen maken. Zo kunnen we specifieke opgaven of groepen van opgaven selecteren die grote maand op maand verschillen laten zien. Deze meldingen controleren we dan handmatig. Vaak is er een logische verklaring voor de resultaten. Soms is het nodig om toch nog iets te corrigeren wat niet automatisch is opgelost in het verwerkingsproces.
-
Uiteindelijk resulteert het verwerkingsproces in (geanonimiseerde) bouwstenen waarmee we de statistieken over de arbeidsmarkt kunnen maken. Verschillende teams binnen het CBS gaan met deze bouwstenen aan de slag. Vaak vinden dan nog statistiek-specifieke bewerkingen en afleidingen plaats. Soms worden de bouwstenen verrijkt met gegevens uit andere statistieken, bijvoorbeeld met persoonsgegevens uit de bevolkingsstatistieken. De volgende statistieken zijn (mede)gebaseerd op de gegevens uit de Polisadministratie. Ze maken de reikwijdte en het belang van de Polisadministratie als bron en de daarop gebaseerde bouwstenen duidelijk.
-
Maandelijkse publicatie
Maandelijks worden de gegevens over banen en lonen op basis van de Polisadministratie op StatLine gepubliceerd. Dat is de digitale databank van het CBS. De betreffende tabel splitst onder andere uit naar bedrijfstak en persoonskenmerken en geeft informatie over de totale hoeveelheid arbeid (arbeidsvolume). De tabel bevat ook seizoensgecorrigeerde cijfers over banen. In deze cijfers zijn jaarlijks terugkerende fenomenen (zoals seizoensarbeid) weggefilterd. Daardoor hangen deze cijfers over banen meer samen met structurele ontwikkelingen op de arbeidsmarkt.Jaarlijkse publicatie
Jaarlijks stelt het CBS definitieve cijfers over banen en lonen samen. Die zijn gebaseerd op alle loonaangiften die tot en met een aantal maanden na afloop van het jaar zijn binnengekomen. Het CBS publiceert een aantal tabellen op StatLine naar aanleiding van deze jaargegevens. Eén van die tabellen bevat bijvoorbeeld gegevens over uurlonen, arbeidsduur, bedrijfsgrootte, bedrijfstak en het soort dienstverband (deeltijd of voltijd). -
Voor de kwantitatieve beschrijving van de Nederlandse economie gebruikt het CBS het boekhoudkundig systeem dat Nationale Rekeningen heet. Onderdeel hiervan, voor de beschrijving van de arbeidsmarkt, zijn de zogeheten Arbeidsrekeningen, met twee keer per kwartaal actuele cijfers. Die zijn onder andere gebaseerd op de gegevens uit de Polisadministratie. Het CBS publiceert deze kwartaalcijfers ook op StatLine. Belangrijke onderwerpen daarbij zijn het aantal werkzame personen, het aantal banen, het aantal gewerkte uren, de beloning en de onderverdeling naar bedrijfstakken.
-
Het CBS stelt de statistieken over de Nederlandse arbeidsmarkt vrij en gratis aan iedereen beschikbaar als Open Data. Het gaat dan om alle gegevens die in de StatLine-databank staan. Als Open Data zijn de gegevens daarmee voor nieuwe toepassingen beschikbaar. Zo heeft het CBS zelf op basis van de Open Data een applicatie ontwikkeld die alle cijfers in grafieken weergeeft.
-
De arbeidsmarktstatistieken die uit de Polisadministratie zijn samengesteld hebben ook een internationaal aspect. Alle EU-lidstaten zijn verplicht om cijfers over de nationale arbeidsmarkt aan het Europese statistiekbureau Eurostat te leveren. Hierdoor kunnen de arbeidsmarktsituaties in de verschillende EU-landen vergeleken worden. De hiervoor genoemde Nationale Rekeningen is een voorbeeld van zo’n Europese verplichting. Apart daarvan levert het CBS kwartaalcijfers aan over arbeidskosten per gewerkt uur voor de Labour Cost Index (LCI) van Eurostat. En eens per vier jaar voert het CBS het Arbeidskostenonderzoek voor Eurostat uit. Doel van het onderzoek is het verkrijgen van gegevens over de omvang en samenstelling van de arbeidskosten in bedrijven en instellingen. De gegevens uit de Polisadministratie vormen hiervoor de belangrijkste bron.
-
Het gebruik van de arbeidsmarktgegevens op basis van de Polisadministratie blijft niet beperkt tot statistieken van het CBS. Ook anderen gebruiken deze gegevens. Zo brengt het Centraal Planbureau (CPB) elk voorjaar het Centraal Economisch Plan (CEP) uit. Deze publicatie geeft een voorspelling van de ontwikkeling van de Nederlandse arbeidsmarkt op de korte termijn. Het CPB beschrijft de werkgelegenheid aan de hand van gewerkte uren, zoals die door het CBS afgeleid zijn vanuit de Polisadministratie. Ook in de publicatie Dynamiek op de Nederlandse arbeidsmarkt, een samenwerking van het CBS met TNO, zijn gegevens uit de Polisadministratie gebruikt. Dit geldt ook voor het rapport Arbeidsmarkt zonder grenzen dat het CBS samen met het Planbureau voor de Leefomgeving (PBL) heeft samengesteld.
-
Naast de arbeidsmarktstatistieken verrijken ook andere statistieken van het CBS - zoals de statistiek over de sociaaleconomische positie van schoolverlaters - zich met de verwerkte gegevens uit de Polisadministratie. Die gegevens spelen ook een belangrijke rol bij diverse opdrachten die het CBS krijgt van bijvoorbeeld ministeries en planbureaus voor eenmalige beleidsonderzoeken. Ook wetenschappers gebruiken de gegevens in studies over de arbeidsmarkt. Dit meervoudig gebruik voorkomt extra werk. Voor arbeidsgegevens voor deze andere statistieken en onderzoeken hoeft namelijk niet meer apart geënquêteerd te worden.
-
De loonaangiftegegevens zijn voor het CBS een cruciale bron voor de beschrijving van de Nederlandse arbeidsmarkt. Dankzij een in hoge mate geautomatiseerd verwerkingsproces kunnen we ruwe loonaangiftegegevens maandelijks verfijnen tot bouwstenen voor diverse statistieken en onderzoeken over de arbeidsmarkt. Het belang van deze bron straalt daarmee ook door naar planbureaus, ministeries en de wetenschap. Met behulp van de gegevens uit de Polisadministratie kunnen actuele maatschappelijke vragen beantwoord worden. Bovendien dienen de cijfers als basis voor een internationale vergelijking van de arbeidsmarktsituatie in de landen van de Europese Unie. Een enkele opgave in de loonaangifte is dus een cruciaal element voor een breed spectrum aan onderzoek en statistiek.
Rik van der Vliet
Projectleider ‘Maandverwerking Polisadministratie’ bij het CBS
-