Participatie in de Genomic Data Infrastructure

Dit artikel beschrijft de deelname van Health-RI aan het “one million genome” (1+MG) initiatief

De Genomic Data Infrastructure (GDI) is een Europees implementatieproject in het kader van het “one million genome” (1+MG) initiatief. Health-RI concentreert de Nederlandse deelname in dit project, dat als doel heeft om de infrastructuur uit te rollen die nodig is om tenminste 1 miljoen genomen (whole genome sequencing) van Europeanen beschikbaar te maken voor hergebruik. De voorziene infrastructuur is een gefedereerde infrastructuur: elk deelnemend land bouwt de infrastructuur om de door dat land bijgedragen genoominformatie via één landelijk punt beschikbaar te maken, en om die data te kunnen bewerken. In Nederland, onder auspicien van Health-RI, willen we deze federatie in principe nog een laag doortrekken, waardoor elk van de Health-RI regio’s zijn eigen deel van de infrastructuur opzet en beheert.

Deelname in GDI is een kans om de Health-RI infrastructuur voor het delen van genoominformatie op te zetten op een manier die compatibel is met de Europese infrastructuur. Ook biedt het project een kans om de Health-RI federatie-technologie, gebaseerd op een catalogus met DCAT structuur, ook in internationale context te laten zien.

Het project wordt in Health-RI gerund vanuit de omics werkgroep in het Architectuurthema, maar heel veel andere onderdelen van Health-RI zijn betrokken.

Vijf Functionaliteiten

Voor GDI moet elke deelnemer vijf functionaliteiten kunnen tonen op een manier die interoperabel is met de internationale standaarden. Deze vijf zijn:

  • Data Vinden (Data Discovery)

  • Data Inclusie (Data Reception)

  • Opslag en Interfaces (Storage and Interfaces)

  • Datatoegangsbeheersapplicaties (Data Access Management Tools)

  • Verwerking (Processing).

Meer informatie hierover is te vinden op de website die het milliongenomesframework beschrijft.

Starter Kit

Om het eenvoudiger te maken om nieuwe landen te laten beginnen met de vijf functionaliteiten is een kit van softwaretools beschikbaar gesteld die in samenhang deze functionaliteiten kunnen leveren. Elk land is echter vrij om hier andere keuzes in te maken en andere tools te gebruiken zolang ze maar interoperabel zijn met de gekozen standaarden.

Namens Nederland heeft UMCG als eerste een installatie ingericht. Andere deelnemers in de omics werkgroep (met name het Prinses Maxima Centrum, de Hartwig Medical Foundation, Amsterdam UMC en Radboudumc) hebben al aangegeven ook later een node in dit netwerk te willen vormen.

Catalogus

Net als voor de Health-RI infrastructuur is de GDI infrastructuur gebouwd rond een catalogus die voor potentiele gebruikers van de gegevens het eerste contactpunt vormt. Health-RI brengt deze catalogusfunctie dan ook in in GDI.

image-20240507-110917.png
Applicatielandschap GDI Starter kit

Data Governance

In GDI is voorzien dat een nieuwe centrale rechtspersoon zal worden opgericht door de Europese commissie, een zogenaamde European Digital Infrastructure Consortium (EDIC), waaraan landen deelnemer worden. De 1+MG EDIC zal de centrale data governance voor 1+MG uitvoeren. Voorzien is daarvoor het opzetten binnen die EDIC van een centraal data access committee. De adviezen van dit centrale comittee kunnen nog wel door een goed gemotiveerd veto uit de data-aanleverende landen worden geblokkeerd.

Nationale Governance

Deelnemende landen in het milliongenomesinitiatief werken elk aan een Nationale Mirrorgroup, een groep van experts die met deelname vanuit overheid en het genoomveld gezamenlijk de beslissingen neemt over de te volgen paden. De nationale afgevaardigden in de werkgroepen van het 1+MG initiatief zijn ook lid van de nationale mirrorgroep. Ook in Nederland is zo’n expertgroep, deze heeft echter nu nog niet het mandaat om beslissingen te nemen en daarmee nog niet de formele status van een mirrorgroup.