Gå til sidens indhold

Præcision og pålidelighed

Kontaktinfo

Arbejde og Indkomst, Personstatistik
Daniel F. Gustafsson
20 51 64 72

dfg@dst.dk

Hent som PDF

Arbejdskraftundersøgelsen (AKU)

Arbejdskraftundersøgelsen (AKU) har en relativt stor stikprøve og der er kontinuerlige forbedringer i opregningsmetoder. Dette giver en pålidelig statistik for befolkningens tilknytning til arbejdsmarkedet, selv om der er usikkerhed knyttet til udvælgelsen af stikprøven og strukturen i bortfaldet.

I 1. kvartal 2016 var svarprocenten usædvanligt lav, hvilket skabte større usikkerhed omkring tallene. Endvidere er web-interview (CAWI) indført som ny dataindsamlingsmetode. De to faktorer skabte brud i tidsserierne. Bruddene er korrigeret på hovedserierne.

Samlet præcision

AKU er som surveyundersøgelse behæftet med statistisk usikkerhed (se Stikprøveusikkerhed). Svarprocenten var i 1. kvartal 2016 45 pct., hvilket er væsentligt lavere end i perioden 2007-2015. Den lave svarprocent i 1. kvartal 2016 har bidraget til, at tallene for 1. kvartal 2016 har en lavere præcision end tidligere. Stikprøveusikkerheden skyldes udvælgelsen af stikprøven og strukturen i bortfaldet. Bortfald er, når man ikke får gennemført et interview med en udvalgt person. Bortfaldet øger undersøgelsens usikkerhed, fordi der ikke er samme sandsynlighed for at opnå interview med alle udvalgte personer. Der er med andre ord bestemte slags grupper, man oftere ikke får lavet interview med, og det påvirker repræsentativiteten i undersøgelsen. Dette håndteres dog i vidt omfang gennem opregningen og brugen af registerbaserede hjælpeinformationer. Disse anvendes til kalibrering og vægtning, hvorved personer, der typisk er underrepræsenterede i undersøgelsen, vil få en højere vægt. Modsat vil personer, der er overrepræsenterede få en lavere vægt, der justerer dem ned i antal. Et eksempel på en skævhed i bortfaldet er fx uddannelsesniveau, hvor personer med længere uddannelser er overrepræsenterede modsat kortuddannede, der typisk er underrepræsenterede. Andre skævheder findes ift. alder, hvor unge mellem 15-24 år er underrepræsenterede. Skævheder i bortfaldet håndteres ved at gange de umiddelbare stikprøvevægte med kalibreringsfaktorer – de såkaldte gi-vægte. gi-vægtene for AKU har et gennemsnit på 0,99. Dette er udtryk for, at vi justerer vægtene lige så meget op som ned. Selvom hjælpeinformationen således håndterer megen skævhed, kan det ikke udelukkes, at der er systematisk skævhed i AKU. Dette vil dog i højere grad påvirke niveauet end udviklingen.

AKU's tidlige tal frem til 1999 er af en lavere kvalitet end de efterfølgende data, hvilket blandt andet skyldes mangel på personnøgle (personnummer).

Stikprøveusikkerhed

Den statistiske usikkerhed spiller især en rolle ved talmæssigt små persongrupper. Derfor afrunder man altid offentliggjorte resultater til nærmeste hele 1.000. Derudover er nogle af opgørelserne suppleret med angivelse af stikprøveusikkerhedens størrelse. Denne størrelse er mulig at skønne ud fra den stratificerede opregning. Man har hermed mulighed for at vurdere, i hvor høj grad en ændring i fx beskæftigelsen blot er udtryk for undersøgelsens usikkerhed, eller om der er tale om en reel stigning eller et fald. Stikprøveusikkerheden påvirkes af stikprøvens størrelse. Usikkerheden halveres fx stort set, hvis man firedobler sit interviewgrundlag. Derfor kan det i flere tilfælde være en fordel at anvende rullende år, dvs. at man bruger interviewdata fra de seneste 4 kvartaler i stedet for kun det seneste kvartal. I offentliggørelsen af resultaterne vil stikprøveusikkerhed være angivet på følgende måde: +/- usikkerheden.

For at give en god beskrivelse af den usikkerhed, der er knyttet til forskellige enten større eller mindre grupper i en stikprøvebaseret undersøgelse, anvender man ofte konfidensintervaller frem for at angive usikkerheden i form af standardafvigelsen eller variansen. I Arbejdskraftundersøgelsen har vi valgt at anvende konfidensintervaller på 95 procent. Det betyder, at hvis undersøgelsen blev gennemført 100 gange og konfidensintervallet blev udregnet hver gang, ville den sande værdi ligge i 95 ud af 100 intervaller, mens den kun ville ligge uden for 5 af intervallerne. Usikkerheden er beregnet som 1,96*standardafvigelsen hvor 1,96 svarer til 97,5-procents-fraktilen i den standardiserede normalfordeling.

Et andet mål for usikkerhed er varianskoefficienten, der viser, hvor stor en andel af estimatet, der udgøres af standardafvigelsen. Varianskoefficienten er dermed et relativt mål. I 1. kvartal 2016 var der en usædvanligt lav svarprocent, hvilket øger usikkerheden. Til gengæld blev personer med forskerbeskyttelse fra 1. kvartal 2016 udtrukket på lige fod med resten af befolkningen, i det at forskerbeskyttelsen blev fjernet, hvilket kan forventes at reducere usikkerheden. Varianskoefficienten var dog noget højere i 1. kvartal 2016 end normalt. I 1. kvartal 2016 var den 0,0031 og 0,0341 for hhv. beskæftigelsen og ledigheden, hvilket gav et konfidensinterval på +/- 16.000 for beskæftigelsen og +/- 13.000 for ledigheden. Til sammenligning var varianskoefficienten for 4. kvartal 2015 0,0027 og 0,0308 for hhv. beskæftigelsen og ledigheden med en konfidensinterval på hhv. +/- 14.000 og +/-10.000.

Grundet stikprøveusikkerheden publiceres der ikke mindre end 4.000 opregnede personer på kvartaler og 2.000 opregnede personer på år.

Stikprøveusikkerhed - Indikatorer

Varianskoefficient (VK): Varians koefficienten er tallet for spredningen af data delt med middelværdien. Spredningen fortæller, hvor langt værdierne ligger fra middelværdien. Varians koefficienten er dermed en vurdering af størrelsen på spredningen - en metode til at præsentere statistisk usikkerhed.

Arbejdskraftundersøgelsen offentliggør varianskoefficienter for beskæftigede og ledige.

Anden usikkerhed

Hvert kvartal dannes en stikprøve fra befolkningsregistret.

Fra 1. januar 2021 er AKU tilpasset EU's nye rammeforordning. Arbejdskraftundersøgelsen har indtil året 2020 været indsamlet på individ niveau for 15-74-årige. Populationen er fra 2021 ændret til også at omfatte aldersgruppen fra 75-89 år. Stikprøven er på kvartalsbasis således forøget fra 34.320 personer til 36.020 personer. Opregningen er ligeledes ændret til også at omfatte aldersgruppen 75-89 år.

Før 2016 havde cirka 13 pct. af stikprøven forskerbeskyttelse og blev dermed ikke kontaktet. Fra og med 1. kvartal 2016 er dette fjernet, og personerne kan indgå i stikprøven. Stikprøven er derfor reduceret fra 40.532 personer til at være 34.320 personer i alderen 15-74 år. Som ved alle andre undersøgelser, der baserer sig på stikprøver, er der en vis usikkerhed tilknyttet undersøgelsen.

Usikkerheden skyldes udvælgelsen af stikprøven og strukturen i bortfaldet. Bortfald er, når man ikke får gennemført et interview med en udvalgt person. Bortfaldet øger undersøgelsens usikkerhed, fordi der ikke er samme sandsynlighed for at opnå interview med alle udvalgte personer. Der er med andre ord bestemte slags grupper, man oftere ikke får lavet interview med, og det påvirker repræsentativiteten i undersøgelsen. Dette håndteres dog i vidt omfang gennem opregningen og brugen af registerbaserede hjælpeinformationer.

For visse grupper kan der dog være kvalitetsproblemer. Det er fx svært at opnå interview med indvandrere og efterkommere, der derfor tit vil være underrepræsenteret i undersøgelsen. Tillige er det også et kendt fænomen, at der indsamles relativt flere proxy-interviews (interviews, hvor et andet husstandsmedlem svarer på respondentens vegne). Dette er primært ved den yngste aldersgruppe af 15-24 årige. AKU har et relativt stort bortfald. Det øgede bortfald i 1. kvartal 2016 kan indebære, at det strukturelle bortfald har en anden karakter i dette kvartal. Borfaldet forsøges håndteret ved hjælp af en kompleks opregning, der anvender hjælpeinformationer fra registre.

Der har tidligere været fire ændringer i opregningen, som man skal være opmærksom på: 2007, 2011, 2015 og 2019. I opregningen for 2019 blev data tilbage til 2008 revideret. Denne revision betyder, at det er 2019-opregningen, der tages udgangspunkt i ved en analyse af evt. opregningsbetingede niveauskift. Den nuværende opregningsmetode omfatter nu anvendelse af aktuel hjælpeinformation om blandt lønmodtagere, ledige og modtagere af forskellige ydelser. Ændringerne i data ved 2019-opregningen var betydelige, og data blevet revideret tilbage i tiden til 2008, året hvor flere af datakilderne til opregningen starter.

Se mere om opregningsmetoder her:

Ny opregning 2019 - faktisk.

Ny opregning 2019 - teoretisk.

Trods opregningens forsøg på at håndtere bias, vil der på enkelte undergrupper stadig være bias. Dette bias kan forventes at være højere i 1. kvartal 2016 og kan bidrage til en øget usikkerhed. Der vil være variable, der kan være problematiske at indsamle via surveys, idet respondenter ikke nødvendigvis kender deres objektive placering, hvilket gælder for fx stilling og branchevariable.

Bortfald

På baggrund af den uvægtede kvartalsvise stikprøve beregnes hvert kvartal en svarprocent og en bortfaldsprocent.

Bortfaldet består bl.a. af personer, der ikke er opnået kontakt med, der var for syge eller handicappede til at deltage og personer, som nægtede at deltage.

Kvalitetsstyring

Danmarks Statistik følger anbefalinger vedrørende organisering og styring af kvalitet, der er givet i Adfærdskodeks for europæiske statistikker (Code of Practice, CoP) og den tilhørende implementeringsmodel Quality Assurance Framework (QAF). Læs mere om disse på Adfærdskodeks for europæiske statistikker. Der er etableret en arbejdsgruppe for kvalitet og en central kvalitetssikringsfunktion, der løbende gennemfører tjek af produkter og processer.

Kvalitetssikring

Danmarks Statistik følger principperne i Adfærdskodeks for europæiske statistikker (Code of Practice, CoP) og bruger den tilhørende implementeringsmodel Quality Assurance Framework (QAF) ved implementeringen af disse principper. Dette indebærer løbende decentrale og centrale tjek af produkter og processer på baggrund af dokumentation, der følger internationale standarder. Den centrale kvalitetssikringsfunktion rapporterer til arbejdsgruppen for Kvalitet. Rapporteringen indeholder blandt andet forslag til forbedringer, som vurderes, besluttes og implementeres.

Kvalitetsvurdering

Den usædvanligt lave svarprocent i 2016 gør, at kvaliteten er lavere end tidligere.

Som ved alle andre undersøgelser, der baserer sig på stikprøver, er der en vis usikkerhed tilknyttet undersøgelsen. Usikkerheden skyldes udvælgelsen af stikprøven og strukturen i bortfaldet. Bortfald er, når man ikke får gennemført et interview med en udvalgt person. Bortfaldet øger undersøgelsens usikkerhed fordi, der ikke er samme sandsynlighed for at opnå interview med alle udvalgte personer. Der er med andre ord bestemte slags grupper, man oftere ikke får lavet interview med, og det påvirker repræsentativiteten i undersøgelsen. Dette håndteres dog i vidt omfang gennem opregningen og brugen af registerbaserede hjælpeinformationer. Disse anvendes til kalibrering og vægtning, hvorved personer, der typisk er underrepræsenterede i surveys, vil få en højere vægt. Selvom hjælpeinformationen således håndterer megen skævhed, kan det ikke udelukkes, at der er systematisk skævhed i AKU. Dette vil dog påvirke niveauet i højere grad end udviklingen.

Den danske AKU indsamles på individer og ikke på husstande, hvilket er den mest udbredte metode i de andre europæiske lande. Omvendt betyder dette, at Danmark har en meget lavere andel af såkaldte proxy-interviews, dvs. interviews hvor én person i husstanden besvarer skemaet på et andet husstandsmedlems vegne. Dette er et kvalitetsproblem, som ikke er så udbredt i Danmark. I Danmark er der en proxy andel på alle indsamlede interviews på mellem 5-6 pct. Dog skal det bemærkes, at for de 15-24-årige er proxy-andelen klart højere med mellem 10-15 pct.

AKU's tidlige tal frem til 1999 er af en lavere kvalitet end de efterfølgende data, hvilket blandt andet skyldes mangel på personnøgle (personnummer).

Revisionspolitik

Danmarks Statistik foretager revisioner i offentliggjorte tal i overensstemmelse med Danmarks Statistiks revisionspolitik. De fælles procedurer og principper i revisionspolitikken er for nogle statistikker suppleret med en specifik revisionspraksis.

Praksis for revisioner

Arbejdskraftundersøgelsen for 4. kvartal 2020 og for 2. kvartal 2021 er den 26. november blevet revideret. Revisionen skyldes uregelmæssigheder hos Danmarks Statistiks eksterne dataleverandør. Beskæftigelsesfrekvensen for de 15-64-årige ændrer sig med revisionen fra 74,7 til 74,8 pct. for 4. kvt. 2020 og fra 75,4 til 75,6 pct. for 2. kvartal 2021. AKU-ledighedsprocenten er med revisionen uændret for de to kvartaler, mens gruppen af 15-64-årige uden for arbejdsstyrken for 4. kvartal 2020 revideres fra 20,6 til 20,5 pct. og for 2. kvartal 2021 fra 20,8 til 20,6 pct.

Der offentliggøres kun endelige tal.