Verhaallijn: Data beschikbaar maken

datum: 23-08-2024 Status: VASTGESTELD

Dit artikel beschrijft de verhaallijn data beschikbaar maken voor meervoudig gebruik. Het gaat hier om zowel onderzoeksdata als om tot onderzoeksdata getransformeerde zorgdata.

Een data-aanbieder maakt een dataset beschikbaar binnen het Health-RI ecosysteem t.b.v. meervoudig gebruik. Na toetsing door de lokale datatoegangscommissie en het Technology Transfer Office (TTO) of en onder welke gebruiksvoorwaarden de desbetreffende dataset beschikbaar gemaakt mag worden, stelt de data-aanbieder de levering op. De data-aanbieder richt het leverproces in, en publiceert de metadata van de dataset t.b.v. de catalogus.

Zie https://health-ri.atlassian.net/wiki/spaces/HNG/pages/608309306 voor een verder ingevulde versie van deze verhaallijn voor data categorie imaging.

Zie ook: IDS-RAM 3.4.2 Data Offering

Opmerkingen

Deze verhaallijn toont alleen het initieel beschikbaar maken van een dataset die geschikt is/wordt gemaakt voor meervoudig gebruik, bijvoorbeeld onderzoek, zoals de data uit bijvoorbeeld een EDC of EPD. Omdat datasets kunnen groeien in de loop der tijd, dient er een synchronisatie-mechanisme geplaatst te worden om datasets te blijven updaten.

De meeste systemen worden dagelijks uitgebreid met nieuwe data.

  • De zorgdataset is dynamisch; het is meer een datadefinitie dan een dataset. Er kunnen in de loop der tijd datasubjecten bijkomen die aan de datadefinitie voldoen.

  • Voor bestaande datasubjecten ontstaan in de loop der tijd nieuwe datapunten. De metadata daarvan komt dynamisch beschikbaar in de portal.

Data vanuit de bronsystemen zal veelal niet rechtstreeks vanuit de productieomgevingen voldoen aan de grondlegger eenheid van taal maar een persistent dataplatform (Data Repository / Middleware) nodig hebben, waar de (meta)data volgens de grondlegger eenheid van taal klaargemaakt wordt voor publicatie in (landelijke) metadata catalogi.

Note: In dit artikel wordt gesproken over 'FAIR gemaakte data'. Daarmee wordt bedoeld dat de data voorzien is van:

  • Context informatie 

  • Codering en modellering volgens de grondlegger eenheid van taal, bij voorkeur volgens richtlijnen van de data governance commissie 

  • Gebruiksvoorwaarden opgesteld door de Lokale datatoegangscommissie

  • Controle op zeggenschap

  • Kenmerken voor de kwaliteit c.q. bruikbaarheid 

  • Versiebeheer

Preconditie

Procesmodel

  1. De databron doet verzoek bij de Lokale datatoegangscommissie of en onder welke voorwaarden data aangeboden mag worden voor meervoudig gebruik.

  2. De lokale datatoegangscommissie bepaalt aan de hand van het opgestelde databeleid of en onder welke gebruiksvoorwaarden de data aangeboden mag worden. 

  3. De databron zoekt contact met de data governance commissie  zodat die

    • voor eerder gedefinieerde data aangeeft hoe deze FAIR te maken, welke codering en modellering toe te passen als de data nog niet of onvoldoende FAIR is.

  4. De databron produceert, creëert en bewaart de originele gezondheidsdata aan de hand van gemaakte afspraken en richtlijnen voor o.a. opslag van data, eigenaarschap, intellectueel eigendom, gebruiksvoorwaarden, selectie en retentie. De databron produceert data bij voorkeur FAIR (zie note hierboven).

  5. De datavoorbereider en databron maken gebruik van een bestaand (herbruikbaar) koppelvlak, of creëren een nieuw herbruikbaar koppelvlak (liefst in samenwerking met de softwareleverancier van de databron) om de taakverdeling tussen de databron en de datavoorbereider te stroomlijnen. 

  6. De datavoorbereider scheidt, vanuit het data-centrische principe, de originele gezondheidsdata van de originele toepassing en prepareert de originele gezondheidsdata, daar waar nodig, ten behoeve van meervoudig gebruik (zo ook voor gebruik voor onderzoek en innovatie) in een persistent dataplatform.  

    • Als de databron de data onvoldoende FAIR gemaakt heeft, zal de datavoorbereider waar mogelijk deze verder FAIR maken (zie note hierboven)

    • Als de databron de data voldoende FAIR gemaakt heeft, zal de datavoorbereider vanuit het data-centrische principe de data beschikbaar stellen op een persistent dataplatform, dat als transportlaag fungeert voor de data-aanbieder. 

    • De data-voorbereider zorgt ervoor dat de metadata van de dataset actueel is

  7. De data-aanbieder richt het leverproces van de dataset in conform de door de datavoorbereider vastgelegde autorisatiemetadata van de dataset en richt indien nodig nog een doeltransformatie in (bv als er nog een pseudonimisering moet worden uitgevoerd).  

  8. De data-aanbieder registreert en publiceert de metadata bij een FAIR data point naar keuze, als een losse applicatie of geïntegreerd in een applicatie met data-repository of metadata-catalogus functionaliteit.

  9. De data-aanbieder meldt het gebruikte FAIR data point bij een FAIR data point register (zie bv FAIR Data Point) aan als dat nog niet eerder is gedaan. Het is de verantwoordelijkheid van de catalogus om regelmatig en/of getriggerd door een zoekopdracht de laatste stand van zaken van de metadata op te halen bij de FAIR data points. (zie Verhaallijn: Data zoeken in metadata ).

  10. De data-aanbieder maakt de dataset direct beschikbaar als de dataset publiek is.

Postconditie

  • De data is beschikbaar op een persistent dataplatform.

  • De data is FAIR gemaakt.

  • De data is

    • direct beschikbaar als deze publiek is

    • beschikbaar na een goedgekeurde aanvraag en aanvullende verwerking (bv dataminimalisatie en pseudonimisering) door de data-aanbieder

  • De metadata van de data is gepubliceerd en vindbaar.

Procesdiagram “data beschikbaar maken”