High performance computing
Hvis du har behov for stor regnekapacitet til dataanalyse, modellering eller machine learning, får du med High Performance Computing (HPC) adgang til en analyseplatform, der kan håndtere komplekse beregninger hurtigt og effektivt.
I modsætning til traditionelle servere giver HPC mulighed for at skalere regnekapaciteten op eller ned efter behov.
Fordele ved HPC:
- Høj ydeevne: Beregn og analysér store datamængder langt hurtigere end på almindelige servere.
- Fleksibilitet: Skalér din kapacitet efter projektets behov.
- Storage: HPC kan opbevare enorme mængder data og hurtigt hente disse fra hukommelsen.
Ikke alle projekter kræver HPC. Hvis du arbejder med mindre datamængder, som kan behandles effektivt på en traditionel server, kan en hosted server være en mere omkostningseffektiv løsning. Hvis dine analyser kræver omfattende databehandling, komplekse simuleringer eller machine-learning-modeller, vil HPC være en fordel. For at kunne anvende HPC til projekter med grunddata, skal det pågældende HPC-center have oprettet en aftale med Danmarks Statistik.
Flere HPC-løsninger – hvilken opfylder jeres behov?
Danmarks Statistik tilbyder tre forskellige løsninger, som er skitseret herunder. Læs nærmere, så du kan vælge den bedste løsning.
API-løsningen
Denne løsning er åben for alle, der har et godkendt projekt i Danmarks Datavindue (DDV) samt en aftale med et af HPC-centrene under ordningen. Du kan se en opdateret liste over, hvilke HPC-centre dette indebærer længere nede på denne side.
Med denne løsning kan brugeren selv bestemme, om data skal ligge både på Forskningsservices servere eller en hosted server og hos HPC-centeret, eller kun hos HPC-centeret. Det er også muligt at have nogle brugere tilknyttet projektet kun i DDV, mens andre er tilknyttet projektet i både DDV og på HPC-centeret. Løsningen gør det desuden muligt at tilknytte HPC-ressourcer i hele eller dele af projektets levetid.
NGC-løsningen
Denne løsning er tilgængelig for sundhedsfaglige projekter, da dette er et krav fra NGC’s side. Projektet skal desuden være placeret på NGC i hele projektets levetid. En fordel ved denne løsning er, at man kan tilkøbe SSPE (se nedenfor).
Shared Secure Processing Environment (SSPE)-løsningen
Denne løsning er udviklet til projekter, der har egne data, som skal tilknyttes projektet, og hvor data enten:
- er meget store og derfor tunge og omkostningsfulde at sende til Forskningsservice (FSE) for afidentificering, eller
- af juridiske grunde ikke må overføres til FSE’s servere.
Løsningen indebærer, at FSE kan behandle data direkte på NGC’s servere. Læs mere om dette længere nede på siden.
Det er nu muligt at tilknytte et projekt i Danmarks Datavindue til et HPC-center i en kortere eller længere periode. Nedenfor kan du få svar på spørgsmål omkring løsningen.
Hvilke HPC-centre er omfattet?
Danmarks Statistik har indgået samarbejde med følgende HPC-centre:
- Computerome (DTU) Læs mere hos Computerome
- GenomeDK (AU) Læs mere hos GenomeDK
Det forventes, at flere centre vil blive tilføjet, og listen vil derfor kunne ændre sig over tid.
Hvad koster det at oprette?
For oprettelsen fakturer Forskningsservice fem timer efter gældende timetakst. Hertil kommer fakturering for dataudtræk, rådgivning, diskleje, behandling af eksterne data mm. Se vores gældende timetakster
De fem timer dækker ikke HPC-centerets omkostninger i forbindelse med oprettelse i deres miljø eller deres driftsomkostninger. Hvis du har spørgsmål til priserne på HPC-centrene, beder vi dig om at kontakte dem direkte.
Hvordan fungerer API-løsningen i forhold til eksterne data?
Eksterne data, der skal kunne sammenkobles med Danmarks statistiks grunddata, skal først sendes til Forskningsservice for at blive afidentificeret. De eksterne data vil herefter blive overført til projektets miljø på HPC-centeret.
Hvilke projekter må tage brug af ordningen?
Alle projekter, der ligger på enten forskermaskinen eller en hosted server, kan tilkøbe denne løsning, såfremt de har indgået en aftale med det relevante HPC-center.
Projektet skal have en godkendt projektindstilling, inden Forskningsservice (FSE) overfører data til HPC-området. Fordi der er tale om en tilkøbsordning, kan du udarbejde og indsende din projektindstilling til FSE, inden aftalen med HPC-centeret er på plads. De data, du får stillet til rådighed, vil først blive trukket og overført til HPC-centeret, efter projektindstillingen er godkendt og FSE har modtaget en kopi af en skriftlig aftale mellem institutionen og HPC-centeret. Kontakt HPC-centeret direkte, hvis du er interesseret i denne form for aftale.
Bemærk: Projekter, der ligger hos Nationalt Genom Center (NGC), kan ikke bruge denne løsning.
Hvordan kommer man i gang?
Først skal man have en aftale med et eller flere HPC-centre. Denne aftale indgås for hele institutionen. Når aftalen med HPC-centeret er på plads, kan I udarbejde en liste over hvilke brugere på hvilke projekter, der skal have adgang til hvilket HPC-center.
Listen sendes til jeres kontaktperson i Forskningsservice, sammen en kopi af aftalen med HPC-centeret, som sørger for at oprette adgang for de enkelte brugere under de relevante projekter.
Har jeg adgang til Danmarks Statistiks grunddata på både forskermaskinen og i HPC-miljøet?
Det er op til det enkelte projekt, om Danmarks Statistiks (DST) grunddata skal ligge på både forskermaskinen (eller en hosted server) og hos HPC-centeret, eller udelukkende hos HPC-centeret.
Det betyder, at nogle brugere på et givent projekt kan have adgang til både forskermaskinen og HPC-ressourcer, mens andre kun har adgang til forskermaskinen. Vær opmærksom på, at hvis man vælger at have data begge steder, skal man stadig betale normal takst for diskleje på forskermaskinen/driftsudgifter på jeres hostede server.
Hvis projektet udelukkende skal behandle data i HPC-miljøet, er det ikke nødvendigt at have data liggende på forskermaskinen. I så fald kan I informere jeres kontaktperson i Forskningsservice (FSE) om, at kopien af data på forskermaskinen ønskes slettet, efter at en kopi er overført til HPC-området.
Udtræksprogrammerne (scripts), der blev brugt til at trække data, gemmes, så de kan genleveres senere ved behov. I dette tilfælde vil der blive oprettet en rammeaftale, der dækker de timer, FSE bruger på at genlevere data.
Bemærk: Det er et krav, at projektet har en aktiv serverplads på enten DST’s egne servere eller en hosted server, da denne bruges til hjemtagelse af filer. Derudover skal login til HPC-miljøet ske via Danmarks Datavindue.
Hvis du arbejder med data fra Danmarks Statistik og har et projekt med et sundhedsfagligt formål, tilbyder vi en HPC-løsning via Nationalt Genom Center (NGC). HPC-løsningen anvender en One-Node-Arkitektur, hvor beregninger udføres på én server ad gangen. HPC-centeret er placeret uden for Danmarks Statistik, men projektet oprettes og kontrolleres af Danmarks Statistik på samme måde som andre projekter. Du administrerer stadig projektet via Danmarks Datavindue.
For at få et nyt eller eksisterende projekt tilknyttet NGC, skal du
- have oprettet et tillæg til din databehandleraftale.
- (gen)indstille dit projekt til godkendelse hos Forskningsservice.
- indgå en aftale med NGC.
- kunne indgå i en dialog med teknisk personale omkring opsætning af serveradgang til NGC.
Betaling for brug af HPC-centeret afregnes direkte med centeret. For at bruge NGC’s HPC-infrastruktur, betaler du for installation, hardwareleje, drift og support.
Hvis du ønsker at arbejde med meget store datamængder og har et projekt med et sundhedsfagligt formål, tilbyder vi en opsætning af projektet via en HPC-løsning ved Nationalt Genom Center (NGC).
Shared Secure Processing Environment, også kaldet SSPE-løsningen, giver dataleverandører mulighed for stille deres data til rådighed i et lukket miljø og brugerne mulighed for at analysere disse data sammen med grunddata. Dette vil dels gøre det muligt at arbejde med projekter, hvor den eksterne datamængde overstiger lager- og beregningskapaciteten på Forskningsservices servere og dels sikre, at forskere, som har indgået juridiske aftaler om ikke at videresende eksterne data, herunder til Danmarks Statistik, kan overholde disse forpligtelser.
SSPE-løsningen er en videreudvikling af NGC-løsningen og indføres ikke som en erstatning for den nuværende opsætning, men som et tilbud til projekter, der har brug for større kapacitet til deres analyse af data. Der gælder derfor de samme krav til projekter, der ønsker at anvende SSPE-løsningen som til projekter, der ønsker at benytte sig af NGC-løsningen.
Kontakt og spørgsmål
- Spørgsmål vedrørende HPC-centeret, software på HPC-miljøet, priser på HPC-ressourcer eller opsætning/vedligehold af HPC-miljø: Kontakt det relevante HPC-center direkte.
- Spørgsmål vedrørende API og SSPE: Kontakt din kontaktperson i Forskningsservice eller skriv til forskningsservice@dst.dk.