Gå til sidens indhold

Data fra dataleverandører til grunddatabanken

Her kan du læse om retningslinjerne for modtagelse af data som ønskes udstillet i Danmarks Datavindues (DDV) grunddatabank.

Hvis en statistikmyndighed har et ønske om udstilling af deres data i DDV’s grunddatabank, retter den pågældende myndighed henvendelse til DDV på ddvgrunddatateam@dst.dk. DDV aftaler et indledende møde med statistikmyndigheden, for at diskutere de overordnede fakta om registeret, herunder størrelse på datasættet, antal tabeller, opdateringstidspunkt og –frekvens, tidsplan samt betingelser for udstilling i DDV’s grunddatabank. Hvis det ønskes, kan Danmarks Statistiks (DST) Data Protection Officer (DPO) inviteres med til mødet.

DST indgår videregivelsesaftaler med alle eksterne dataleverandører med henblik på at overdrage dataejerskab og –ansvar til DST. Aftalerne specificerer opdateringsform og frekvens, håndtering af databrud m.m.

Herefter bliver kommunikationen mere detaljeorienteret, der aftales fx navngivning af registeret og hvordan data overføres til DDV. Formaterne skal overholde nedennævnte kvalitetskrav.

Modtagelse af eksterne data

Levering i form af overførsel via SFTP-server foretrækkes af DDV. DDV vejleder og hjælper med at få sat denne proces op. Andre leveringsformer er dog også mulige.

Datatyper og kvalitetskrav til data, der skal i grunddatabanken

Alle data skal følge en række krav og standarder i forhold til formater, navngivning m.m. Dette for at data samlet kan udstilles ensartet, standardiseret og nemt tilgængeligt. Data kombineres på kryds og tværs, og for at dette er muligt ønskes data standardiseret både på tværs af registre og frem og tilbage i tid.

Leverandøren skal ved oprettelse af data sørge for, at disse lever op til de generelle retningslinjer for oprettelse af Grunddata i DDV. 

Variabeltyper, -længde og –navne

Datatyper relaterer sig til indholdet af variablen. I det følgende beskrives, hvordan man afgør hvilken datatype en variabel skal have.

Nøgler og identer

Nøgler og identer bør hedde det samme på tværs af alle dataserier, og skal alle være defineret som karakter-variable, og når den har rent numerisk indhold skal den have foranstillede nuller (se nedenfor).

De skal desuden have en retvisende og præcis længdeangivelse i forhold til max værdi af indholdet og længden skal være ens over tid.

Eksempler (Navn, Vartype, Længde):
PNR CHAR 10
CVRNR CHAR 8 
SENR CHAR 8 (Foranstillede nuller) 
JOURNR CHAR 16 
RECNUM CHAR 16 
EJENDOMSNUMMER CHAR 6 (Foranstillede nuller) 
ADRESSE_ID CHAR 8 (Foranstillede nuller)
Etc.

Der er selvfølgelig flere nøgler og identer end ovenfor listede. DDV sparrer gerne omkring disse for korrekt oprettelse af disse.

Karaktervariable – Klassifikationer

Klassifikationer, såsom KØN, ALDER, KOM, CIVILSTAND, hvor værdien i variablen kan omsættes til en tekst, via en kode-tekst-tabel eller formatbeskrivelse, skal defineres som karakter-variable. Langt de fleste variable vil være af denne type. Disse felter skal desuden have en retvisende længdeangivelse og felter med længde > 1 skal have foranstillede nuller, når den har rent numerisk indhold.

Numeriske variable – Beregningsvariable

Variable, der kan beregnes på, såsom mængder, summer, beløb eller antal vil være af typen numerisk. Variablen skal have en retvisende længdeangivelse i forhold til max værdi.

Eksempelvis skal ALDER være defineret som CHAR (3), da max værdien kan være over 100. Eksempel på indhold, når der er foranstillet med nuller - ALDER = 001, 010, 100.

Dato variable

Datoangivelser kan både være rene datoer, men hvor det giver mening med tidsangivelsen kan de også være af typen timestamp.

Variabelnavne

Må som udgangspunkt ikke indeholde Ææ, Øø eller Åå

Missing – manglende værdier i SAS

Variabeltype    Missing i SAS
Numerisk          . (punktum)
Karakter            '' (tom streng) 

1. Numeriske variabler

.   et punktum kan håndteres i SAS, når det handler om en numerisk variabel

2. Karaktervariabler

Tom streng ''  . Dette betyder at variablen er karakter, men indeholder ingen værdi(tegn).

Der skal ikke skrives "Ukendt" ,"None" eller 0 . 

Dokumentationskrav til eksterne data, der skal i grunddatabanken

Den eksterne dataleverandør leverer register- og variabeldokumentation i forbindelse med indgåelse af leveranceaftalens indgåelse. Dokumentationen udstilles i DDV App’en og på DST’s hjemmeside. Dokumentation kan uploades via Metadata-loaderen. Vejledning kan sendes efter aftale.

Variabelbeskrivelserne udstilles i DDV App’en, efter at dokumentationen er uploadet, således at brugerne kan finde dokumentationen i forbindelse med bestilling af data.

Yderligere beskrivelser af grunddataregistret lægges ud på DDV’s hjemmeside under Data fra andre kilder, hvor registeret får sit eget afsnit.

Udover ovennævnte dokumentation, ligger der også et krav hos dataleverandøren om at holde DDV ajour med databrud, ændringer i indberetninger, ændringer i lovgivning m.v. Der ønskes en skriftlig orientering, så DDV kan videregive den til brugerne eller tilføje den på hjemmesiden. Dette specificeres nærmere i den Videregivelsesaftale der udarbejdes mellem dataleverandør og DDV.