Data fra dataleverandører til grunddatabanken
Her kan du læse om retningslinjerne for modtagelse af data som ønskes udstillet i Danmarks Datavindues (DDV) grunddatabank.
Hvis en statistikmyndighed har et ønske om udstilling af deres data i DDV’s grunddatabank, retter den pågældende myndighed henvendelse til DDV på ddvgrunddatateam@dst.dk. DDV aftaler et indledende møde med statistikmyndigheden, for at diskutere de overordnede fakta om registeret, herunder størrelse på datasættet, antal tabeller, opdateringstidspunkt og –frekvens, tidsplan samt betingelser for udstilling i DDV’s grunddatabank. Hvis det ønskes, kan Danmarks Statistiks (DST) Data Protection Officer (DPO) inviteres med til mødet.
DST indgår videregivelsesaftaler med alle eksterne dataleverandører med henblik på at overdrage dataejerskab og –ansvar til DST. Aftalerne specificerer opdateringsform og frekvens, håndtering af databrud m.m.
Herefter bliver kommunikationen mere detaljeorienteret, der aftales fx navngivning af registeret og hvordan data overføres til DDV. Formaterne skal overholde nedennævnte kvalitetskrav.
Modtagelse af eksterne data
Levering i form af overførsel via SFTP-server foretrækkes af DDV. DDV vejleder og hjælper med at få sat denne proces op. Andre leveringsformer er dog også mulige.
Alle data skal følge en række krav og standarder i forhold til formater, navngivning m.m. Dette for at data samlet kan udstilles ensartet, standardiseret og nemt tilgængeligt. Data kombineres på kryds og tværs, og for at dette er muligt ønskes data standardiseret både på tværs af registre og frem og tilbage i tid.
Leverandøren skal ved oprettelse af data sørge for, at disse lever op til de generelle retningslinjer for oprettelse af Grunddata i DDV.
Variabeltyper, -længde og –navne
Datatyper relaterer sig til indholdet af variablen. I det følgende beskrives, hvordan man afgør hvilken datatype en variabel skal have.
Nøgler og identer
Nøgler og identer bør hedde det samme på tværs af alle dataserier, og skal alle være defineret som karakter-variable, og når den har rent numerisk indhold skal den have foranstillede nuller (se nedenfor).
De skal desuden have en retvisende og præcis længdeangivelse i forhold til max værdi af indholdet og længden skal være ens over tid.
Eksempler (Navn, Vartype, Længde):
PNR CHAR 10
CVRNR CHAR 8
SENR CHAR 8 (Foranstillede nuller)
JOURNR CHAR 16
RECNUM CHAR 16
EJENDOMSNUMMER CHAR 6 (Foranstillede nuller)
ADRESSE_ID CHAR 8 (Foranstillede nuller)
Etc.
Der er selvfølgelig flere nøgler og identer end ovenfor listede. DDV sparrer gerne omkring disse for korrekt oprettelse af disse.
Karaktervariable – Klassifikationer
Klassifikationer, såsom KØN, ALDER, KOM, CIVILSTAND, hvor værdien i variablen kan omsættes til en tekst, via en kode-tekst-tabel eller formatbeskrivelse, skal defineres som karakter-variable. Langt de fleste variable vil være af denne type. Disse felter skal desuden have en retvisende længdeangivelse og felter med længde > 1 skal have foranstillede nuller, når den har rent numerisk indhold.
Numeriske variable – Beregningsvariable
Variable, der kan beregnes på, såsom mængder, summer, beløb eller antal vil være af typen numerisk. Variablen skal have en retvisende længdeangivelse i forhold til max værdi.
Eksempelvis skal ALDER være defineret som CHAR (3), da max værdien kan være over 100. Eksempel på indhold, når der er foranstillet med nuller - ALDER = 001, 010, 100.
Dato variable
Datoangivelser kan både være rene datoer, men hvor det giver mening med tidsangivelsen kan de også være af typen timestamp.
Variabelnavne
Må som udgangspunkt ikke indeholde Ææ, Øø eller Åå
Missing – manglende værdier i SAS
Variabeltype Missing i SAS
Numerisk . (punktum)
Karakter '' (tom streng)
1. Numeriske variabler
. et punktum kan håndteres i SAS, når det handler om en numerisk variabel
2. Karaktervariabler
Tom streng '' . Dette betyder at variablen er karakter, men indeholder ingen værdi(tegn).
Der skal ikke skrives "Ukendt" ,"None" eller 0 .
Dokumentationskrav til eksterne data, der skal i grunddatabanken
Den eksterne dataleverandør leverer register- og variabeldokumentation i forbindelse med indgåelse af leveranceaftalens indgåelse. Dokumentationen udstilles i DDV App’en og på DST’s hjemmeside. Dokumentation kan uploades via Metadata-loaderen. Vejledning kan sendes efter aftale.
Variabelbeskrivelserne udstilles i DDV App’en, efter at dokumentationen er uploadet, således at brugerne kan finde dokumentationen i forbindelse med bestilling af data.
Yderligere beskrivelser af grunddataregistret lægges ud på DDV’s hjemmeside under Data fra andre kilder, hvor registeret får sit eget afsnit.
Udover ovennævnte dokumentation, ligger der også et krav hos dataleverandøren om at holde DDV ajour med databrud, ændringer i indberetninger, ændringer i lovgivning m.v. Der ønskes en skriftlig orientering, så DDV kan videregive den til brugerne eller tilføje den på hjemmesiden. Dette specificeres nærmere i den Videregivelsesaftale der udarbejdes mellem dataleverandør og DDV.