Gå til sidens indhold

Grunddatabanken

Her kan du læse en generel beskrivelse af grunddata i Danmarks Datavindue (DDV).

Grunddata (også kaldt ’DDV grunddata’, eller ’data i Danmarks Datavindues grunddatabank’) er de mikrodata, DDV tilbyder eksterne brugere til forskning og statistiske formål. Danmarks Statistik (DST) har samlet en lang række registerdata med historik i en grunddatabank i DDV App’en. De forskellige registre kommer både fra eksterne kilder og fra statistikkontorerne. Emnemæssigt spænder dataene bredt og den statistiske enhed kan være personer, adresser, virksomheder, bibliotekslån, motorkøretøjer m.m. Alle grunddata skal følge en række standarder for formater og navngivning m.m.

Data gennemgår en omfattende behandling, før de lægges i grunddatabanken. Det er der flere grunde til:

  1. Standardisering sparer brugerne for tidskrævende forarbejde: ved at sikre ensartede data undgår eksterne brugere i højere grad manuel databehandling.
  2. Nøglevariable skal være standardiserede for at muliggøre datakobling: for at sammenstille data på tværs af år og registre kræves en fælles standard for nøglevariable.
  3. Nøglevariable skal være standardiserede for at muliggøre pseudonymisering: data kan kun pseudonymiseres korrekt, hvis variablerne følger en fast standard og navngivning.

Formålet med grunddatabanken

Formålet med grunddatabanken er at samle mikrodata til forskning og analyse på en måde som gør det let og enkelt at stille mikrodata til rådighed for forskere.

Indhold i og anvendelse af grunddatabanken

DDV tilstræber, at alle DST’s data fra det officielle statistikprogram er tilgængelige i grunddata. Dette gælder først og fremmest mikrodata, der knytter sig til personer, virksomheder eller adresser.

I DST forefindes også data, der ikke er på det officielle statistikprogram, men som DDV af forskellige årsager har fået leveret eller indsamlet. Denne type data stilles også til rådighed som grunddata med henblik på genbrug, frem for at statistikkontorerne skal designe skræddersyede udtræk til brugerne.

For at disse data kan kvalificeres som grunddata skal en række betingelser overholdes. For visse data kan der være særlige forhold med hensyn til datafortrolighed, finansieringsform eller datakvalitet, der påvirker hvordan data kan anvendes. DST indgår aftaler med andre styrelser (og dataejere) om faste leverancer af registerdata, der kan stilles til rådighed for forskerne. Disse data placeres ligeledes i grunddata. Læs mere om Data fra andre dataleverandører til grunddatabanken.

Før data må anvendes på forskerserveren, sker der en pseudonymisering af variable, der kan bruges til en direkte identifikation af individer. Det betyder, at alle variable med identifikationsoplysninger f.eks. CPR-nummer, CVR-nummer, adresse og ejendomsnumre m.v. omkodes i en pseudonymiseringsproces inden overførsel til brugerens projekt. På hvert register findes der en markering af hvilke variable, der skal pseudonymiseres. Når der kommer nye variable i et register, foretager DDV en vurdering af, i samarbejde med dataejeren og med udgangspunkt i politikken for datafortrolighed, om variable skal pseudonymiseres, før data kan frigives til brug for forskning og analyse.

Anvendelsen af de beskrevne procedurer og retningslinjer for grunddata medfører, at data opbevares i grunddata og præsenteres i DST på en standardiseret form. Dette gør det nemt for forskerne at tilgå data og orientere sig i udbuddet af data. Læs mere om hvor du kan finde dokumentation på grunddata på siden Dokumentation af data.