datum: 23-08-2024 Status: In ONTWIKKELING

Naar aanleiding van feedback op de vorige versie van deze verhaallijn is in dit artikel de verhaallijn onderzoek, beleid en innovatie opnieuw beschreven.

In deze verhaallijn gaan we nu uit van de volgende typen onderzoek:

Een onderzoek dat nieuwe data verzamelt, verwerkt, analyseert en publiceert.
Een onderzoek dat nieuwe data verzamelt, combineert met bestaande data, analyses uitvoert en de resultaten publiceert.
Een onderzoek dat bestaande data verzamelt, verwerkt, analyseert en publiceert.

Er zijn er nog meer maar wat alle onderzoeken gemeen hebben is dat ze worden voorbereid en dat het onderzoek en de data uiteindelijk wordt gepubliceerd.

Dit artikel is geschreven mbv de context van de data life cycle (DLC) en de HORA bedrijfsprocessen onderzoek.

De overkoepelende verhaallijn is een essentiële cases, welke door de Nationale gezondheidsdata-infrastructuur voor onderzoek, beleid en innovatie ondersteund moet worden. Deze verhaallijn raakt vrijwel aan alle aspecten. Dit houdt in dat deze verhaallijn gedragen moet worden door de verschillende werkgroepen, die actief met de Health-RI wiki. Er is vanuit verschillende werkgroepen feedback geleverd op deze verhaallijn, die nog onderling afgestemd dient te worden. Deze feedback zal in de volgende versie worden meegenomen om dan tot een breed gedragen definitie te komen.

In dit artikel wordt de verhaallijn onderzoek, beleid en innovatie opgedeeld in 5 fases, in de beschrijving van de fases worden ze gerelateerd aan de HORA bedrijfsprocessen en data life cycle stadia.

HORA 2.1 Bedrijfsprocessen onderzoek

DLC Stadium	Omschrijving	Actor
Plannen	Definiëren onderzoeksvraag en onderzoeksontwerp, ethische goedkeuring verkrijgen, opstellen datamanagementplan	Onderzoeker
Verzamelen (Collect)	Data verzamelen (zowel nieuwe data genereren als bestaande data aanvragen)	Onderzoeker
Verwerken (Process)	Opschoning en FAIRificatie van gegevens	Onderzoeker, datahouder
Analyseren	Uitvoeren van het onderzoek	Onderzoeker
Bewaren (Preserve)	Bewaren en archiveren van data	Onderzoeker, datahouder
Delen (Share)	Data voorbereiden en beschikbaar maken	Onderzoeker
Hergebruik(Reuse)	Data beschikbaar maken voor andere onderzoekers	Onderzoeker

Er zijn verschillende soorten onderzoek. In dit artikel onderscheiden we de volgende varianten.

Onderzoeksvarianten		Data life Cycle stadia
		Plan-nen	Verza-melen 1 data gene-reren	Verza-melen 2 data aanvragen	Verwer-ken door onder-zoeker	Verwerken door data houder	Analy-seren	Bewa-ren	Delen & Herge-bruiken
A	Onderzoeker gaat data verzamelen met bv een EDC tool, de input verwerken en analyseren en het resultaat beschikbaar maken	Ja	Ja	Nee	Ja	Nee	Ja	Ja	Ja
B	Onderzoeker gaat data verzamelen met een EDC tool, de input combineren met andere data, het geheel verwerken en analyseren en het resultaat beschikbaar maken	Ja	Ja	Ja	Ja	Ja	Ja	Ja	Ja
C	Onderzoeker gaat data verzamelen uit 1 of meerdere bronnen, analyses uitvoeren en het resultaat beschikbaar maken	Ja	Nee	Ja	Nee	Ja	Ja	Ja	Ja

Fase 1: initiatie onderzoek en planning

Doel: mandaat krijgen voor de uitvoering van een onderzoek

HORA processen

opzetten onderzoekscollaboratie
opstellen onderzoeksvoorstel
werven onderzoeksmiddelen

DLC stadium

Plannen	Verzamelen	Verwerken	Analyseren	Bewaren	Delen en hergebruik

Plannen	Verzamelen	Verwerken	Analyseren	Bewaren	Delen en hergebruik

Trigger: een onderzoeker heeft een onderzoeksvraag en wil een onderzoek uitvoeren.

De onderzoeker maakt een onderzoeksvoorstel met daarin (evt met onderzoekspartners) de onderdelen
1. een onderzoeksopzet
2. een onderzoeksplan
3. een onderzoeksvraag
4. de benodigde resources
5. een eerste opzet van een datamanagementplan met daarin o.a.
  1. de te gebruiken databronnen
  2. de te gebruiken codetabellen en metadata sjablonen (voorgeschreven door een data-governancecommissie)
6. een beschrijving van de benodigde onderzoeksomgeving en aanvullende gereedschappen
7. indien van toepassing, zeggenschap van -voor het onderzoek geschikte- datasubjects
De onderzoeker identificeert de te gebruiken bronnen voor het onderzoek (via Verhaallijn: Data zoeken in metadata)
1. de onderzoeker zoekt in de catalogus naar geschikte bronnen
2. de onderzoeker filtert de resultaten desgewenst om tot een nauwkeuriger resultaat te komen
3. indien nodig om de benodigde gegevens te vinden identificeert de onderzoeker zich bij de catalogus
4. om te verifiëren dat de gegevens geschikt zijn kan de onderzoeker direct vragen stellen aan de data-aanbieder
5. de onderzoeker neemt de identifiers van geschikte en te gebruiken bronnen over in het projectvoorstel en data management plan.
De onderzoeker maakt een financieringsaanvraag voor het onderzoeksvoorstel en dient dat in bij een funder indien van toepassing.
De funder beoordeelt de aanvraag en geeft een akkoord.
De onderzoeker rondt het onderzoeksvoorstel af en dient het (bij de lokale toetsingscommissie onderzoek) in voor toetsing. De toetsing kan omvatten:
1. een juridische toetsing
2. een ethische toetsing
3. een toetsing op maatschappelijke aspecten
4. een toetsing door een Technology Transfer Office
De lokale toetsingscommissie onderzoek beoordeelt het onderzoeksvoorstel zelf, laat de benodigde toetsingen uitvoeren en geeft -als die allemaal ook akkoord gaan- een akkoord op het onderzoeksvoorstel.

Mijlpaalproducten:

goedgekeurd onderzoeksvoorstel
eerste opzet datamanagementplan
financiële dekking voor het onderzoek

Fase 2: onderzoeksvoorbereiding

Doel: alle onderdelen prepareren voor de uitvoering van het onderzoek

HORA processen

(her)gebruiken onderzoeksgegevens

DLC stadium

Plannen	Verzamelen	Verwerken	Analyseren	Bewaren	Delen en hergebruik

Plannen	Verzamelen	Verwerken	Analyseren	Bewaren	Delen en hergebruik

Trigger: het onderzoeksvoorstel is goedgekeurd.

Variant A: de onderzoeker gaat nieuwe data verzamelen, verwerken en analyseren

De onderzoeker doet een aanvraag voor een onderzoeksomgeving en aanvullende gereedschappen bij de gereedschapsleverancier om:
1. een data managementplan te onderhouden voor herbruikbare onderzoeksresultaten
2. de zeggenschap van de burger (informed consent / opt-out) vast te leggen
3. data te genereren en beheren
De leverancier stelt de onderzoeksomgeving en de aanvullende gereedschappen ter beschikking aan de onderzoeker.
De onderzoeker configureert de aanvullende gereedschappen naar wens (de onderzoeker ontwerpt bv een ECRF (Electronisch Case Report Form) om data te verzamelen).
De onderzoeker vult het Data management plan aan, gebruik makend van codetabellen en metadata templates die zijn voorgeschreven door de data-governancecommissie
De Lokale datatoegangscommissie van de betreffende datahouder geeft aan onder welke gebruiksvoorwaarden data bij de databron vastgelegd mag worden t.b.v. meervoudig gebruik.

Variant B en C: de onderzoeker heeft voor het onderzoek bestaande data nodig. De onderzoeker doet een aanvraag om de voor het onderzoek te gebruiken bronnen ter beschikking te stellen (Verhaallijn: Data aanvragen)

de onderzoeker logt in op het Nationale Gezondheidsportaal en vult een aanvraagformulier in voor de beoogde bronnen onder vermelding van:
1. Identiteit van de beoogde datagebruiker(s)
2. Vermelding van de gewenste datasets respectievelijk de data-aanbieders
3. De onderzoeksopzet en de rationale (waaronder bijvoorbeeld de duur van het onderzoek) voor het gebruik van de gewenste datasets
4. De gewenste analyse op de gewenste datasets icm evt andere voor de analyse benodigde data
5. Toe te passen veilige verwerkingsomgeving en aanvullende gereedschappen mbv de Gereedschapsleverancier
6. Goedkeuring van de lokale toetsingscommissie onderzoek
De data-aanvraagdienst faciliteert en administreert het proces voor de datagebruiker om geselecteerde dataset(s) aan te vragen bij de centrale datatoegangscommissie.
De centrale datatoegangscommissie verifieert of de aanvraag compleet is en of de gewenste uit te voeren analyse voldoet aan de gebruiksvoorwaarden van de aangevraagde dataset(s).
De data-aanvraagdienst registreert het antwoord van de centrale datatoegangscommissie en faciliteert en administreert het proces voor de datagebruiker om geselecteerde dataset(s) aan te vragen bij de data-aanbieder(s).
De benaderde data-aanbieder verifieert:
1. dat de aanvraag voldoet aan de geldende gebruiksvoorwaarden van de aangevraagde data
2. dat er geen veto is van de lokale datatoegangscommissie op de aanvraag
  en legt het resultaat van de beoordeling vast bij de data-aanvraagdienst
De data-aanvraagdienst koppelt het resultaat van de beoordelingen terug naar de datagebruiker.
De data-aanvraagdienst verstuurt de contracten (bv data access agreements) naar betrokken partijen.
De betrokken partijen ondertekenen de contracten.
Na ondertekening van de contracten stuurt de data-aanvraagdienst een notificatie naar de data-aanbieder(s) dat de data beschikbaar gemaakt kan worden op de aangevraagde veilige verwerkingsomgeving of beschikbaar gemaakt kan worden tbv een gefedereerde analyse.
De leverancier veilige verwerkingsomgeving installeert en configureert de gewenste veilige verwerkingsomgeving met de gewenste gereedschappen zoals de data-gebruiker dat in zijn aanvraag heeft verzocht.
Iedere data-aanbieder stelt de aangevraagde data ter beschikking (Verhaallijn: Data-uitgifte na aanvraag)
1. op de gewenste veilige verwerkingsomgeving (voor de duur van het onderzoek zoals is overeengekomen in de data-aanvraag dan wel wettelijk is vastgesteld).
  1. De data-aanbieder minimaliseert de dataset.
  2. De data-aanbieder raadpleegt het zeggenschapsregister om data te onderdrukken waarvoor geen toestemming is gegeven of waar bezwaar tegen is gemaakt (indien nodig).
  3. De data-aanbieder voert (indien nodig) een pseudonimisering (door middel van de generieke dienst pseudomiseringsdienst) uit op de aangevraagde dataset.
  4. De data-aanbieder maakt de data beschikbaar ten behoeve van de gewenste veilige verwerkingsomgeving.
  5. De data-aanbieder meldt aan de localisatiedienst welke data voor welk onderzoek ter beschikking zijn gesteld
  6. De data-aanbieder meldt aan de data-aanvraagdienst dat de gewenste dataset ter beschikking is gesteld zodat de status van aanvraag kan worden bijgewerkt
  7. De data-aanbieder borgt de reproduceerbaarheid van de dataset, bv om de data-uitgifte op een later tijdstip te kunnen herhalen.
2. ten behoeve van een gefedereerde analyse
  1. Iedere bij deze gefedereerde analyse betrokken data-aanbieder minimaliseert de dataset.
  2. Iedere bij deze gefedereerde analyse betrokken data-aanbieder raadpleegt het zeggenschapsregister om data te onderdrukken waarvoor geen passende zeggenschap is (indien nodig).
  3. Iedere bij deze gefedereerde analyse betrokken data-aanbieder voert de gewenste, dan wel vereiste pseudonimisering (door middel van de generieke dienst pseudonimiseringsdienst) uit op de aangevraagde dataset.
  4. Iedere bij deze gefedereerde analyse betrokken data-aanbieder maakt de data beschikbaar voor levering aan de voor deze gefedereerde analyse aangewezen data processor.
  5. Iedere bij deze gefedereerde analyse betrokken data-aanbieder meldt aan de localisatiedienst welke gegevens voor welk onderzoek ter beschikking zijn gesteld.
  6. Iedere bij deze gefedereerde analyse betrokken data-aanbieder meldt aan de data-aanvraagdienst dat de gewenste dataset ter beschikking is gesteld zodat de status van aanvraag kan worden bijgewerkt.
  7. Iedere bij deze gefedereerde analyse betrokken data-aanbieder borgt de reproduceerbaarheid van de dataset, bv om de data-uitgifte op een later tijdstip te kunnen herhalen.

Mijlpaalproducten:

een veilige verwerkingsomgeving
geïnstalleerde tools
ter beschikking gestelde dataset
bijgewerkte localisatiegegevens
gearchiveerde dataset
een aangepast datamanagementplan

Fase 3: onderzoeksuitvoering

Doel: komen tot onderzoeksresultaten

HORA processen

creëren nieuwe onderzoeksgegevens
verwerken en analyseren onderzoeksgegevens
produceren onderzoeksresultaten

DLC stadium

Plannen	Verzamelen	Verwerken	Analyseren	Bewaren	Delen en hergebruik

Plannen	Verzamelen	Verwerken	Analyseren	Bewaren	Delen en hergebruik

Trigger: er is een bericht dat de aangevraagde data en/of de onderzoeksomgeving beschikbaar is (indien van toepassing)

Variant A: Nieuwe onderzoeksdata genereren en verwerken/analyseren ( https://health-ri.atlassian.net/wiki/spaces/BWV2/pages/249071826)

31. De databron begint met het genereren van nieuwe datapunten.

Wanneer de data gegenereerd is dan ontvangt de datagebruiker de gegenereerde data.
De datagebruiker gebruikt de gereedschappen op de onderzoeksomgeving om de gegenereerde data verder te verwerken en te analyseren.

Variant B: Nieuwe onderzoeksdata genereren en combineren met aangevraagde data (Verhaallijn: Centraal analyseren)

31. De databron begint met het genereren van nieuwe datapunten.

Wanneer de data gegenereerd is dan ontvangt de datagebruiker de gegenereerde data.
De datagebruiker gebruikt de gereedschappen op de onderzoeksomgeving om de gegenereerde data verder te verder te verwerken en te analyseren.
De datagebruiker combineert de gegenereerde data met aangevraagde data: het resultaat is de invoerdata voor de verdere analyse.
De datagebruiker geeft de onderzoeksomgeving opdracht om de door de datagebruiker vastgestelde en goedgekeurde analyse uit te voeren op de invoerdata.
De veilige verwerkingsomgeving voert de door de datagebruiker vastgestelde en goedgekeurde analyse uit op de invoerdata.
De datagebruiker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of nu worden vastgelegd in het data managementplan om de definitieve onderzoeksresultaten te genereren.

Variant C: Aangevraagde data analyseren (Verhaallijn: Centraal analyseren)

De datagebruiker geeft de onderzoeksomgeving opdracht om de door de datagebruiker vastgestelde en goedgekeurde analyse uit te voeren op de invoerdata.
De veilige verwerkingsomgeving voert de door de datagebruiker vastgestelde en goedgekeurde analyse uit op de invoerdata.
De datagebruiker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of nu worden vastgelegd in het data managementplan om de definitieve onderzoeksresultaten te genereren.

Mijlpaalproducten:

dataset met onderzoeksresultaten
metadata van de dataset met onderzoeksresultaten
ontwikkelde/ getrainde algoritmen (optioneel)
analyse scripts of software code

Fase 4: onderzoekspublicatie

Doel: uitgeven van een manuscript en beschikbaar stellen van de onderzoeksresultaten.

HORA processen:

dissemineren onderzoeksresultaten
preserveren onderzoeksresultaten en onderzoeksgegevens
waarborgen vindbaarheid onderzoeksgegevens
waarborgen toegankelijkheid onderzoeksgegevens
waarborgen herbruikbaarheid onderzoeksgegevens

DLC stadium

Plannen	Verzamelen	Verwerken	Analyseren	Bewaren	Delen en hergebruik

Plannen	Verzamelen	Verwerken	Analyseren	Bewaren	Delen en hergebruik

Trigger: het onderzoek is afgerond en er zijn onderzoeksresultaten om te publiceren

De onderzoeker acteert hier in de rol van data-aanbieder. Een aantal activiteiten kunnen ook worden uitgevoerd door het onderzoeksinstituut.

De onderzoeker publiceert de conclusies en resultaten in een manuscript.
De onderzoeker zorgt ervoor dat de onderzoeksdata en onderzoeksresultaten gearchiveerd worden.
De onderzoeker vraagt aan de Lokale datatoegangscommissie of en onder welke gebruiksvoorwaarden de onderzoeksresultaten vastgelegd mogen worden t.b.v. meervoudig gebruik.
De Lokale datatoegangscommissie van betreffende datahouder geeft aan onder welke gebruiksvoorwaarden de onderzoeksresultaten vastgelegd mogen worden t.b.v. meervoudig gebruik.
De onderzoeker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of worden vastgelegd in het data managementplan om de onderzoeksresultaten geschikt te maken voor meervoudig gebruik (optioneel).
De onderzoeker documenteert de dataset met onderzoeksresultaten en maakt de dataset beschikbaar.
De onderzoeker notificeert de localisatiedienst indien nodig over de gepubliceerde data.
De onderzoeker maakt een actueel metadatabestand over de onderzoeksresultaten dataset en registreert en publiceert de metadata bij een FAIR data point naar keuze, mbv een losse applicatie of geïntegreerd in een applicatie met data-repository of metadata-catalogus functionaliteit.
De onderzoeker meldt het gebruikte FAIR data point bij een FAIR data point register (zie bv FAIR Data Point) aan als dat nog niet eerder is gedaan. Het is de verantwoordelijkheid van de catalogus om regelmatig en/of getriggerd door een zoekopdracht de laatste stand van zaken van de metadata op te halen bij de FAIR data points.

Mijlpaalproducten:

manuscript
gepubliceerde onderzoeksresultaten dataset
op een FDP gepubliceerde metadata
gepubliceerde workflows en/of algoritmen (optioneel)

Fase 5: onderzoeksafsluiting

Doel: het formeel afsluiten van het onderzoek en opruimen van de gebruikte data en omgeving

HORA processen

archiveren onderzoeksresultaten

DLC stadium

Plannen	Verzamelen	Verwerken	Analyseren	Bewaren	Delen en hergebruik

Plannen	Verzamelen	Verwerken	Analyseren	Bewaren	Delen en hergebruik

Trigger: het onderzoek is afgerond en de onderzoeksresultaten zijn gepubliceerd

De onderzoeker zorgt ervoor dat de onderzoeksdata, onderzoeksresultaten en de documentatie gearchiveerd worden.
De onderzoeker richt het beheer van de onderzoeksresultaten dataset en de metadata van de dataset in
De onderzoeker zorgt ervoor dat de onderzoeksomgeving, de onderzoeksdata en onderzoeksresultaten opgeruimd worden.

Mijlpaalproducten:

gearchiveerde data en documentatie
ingericht data beheerproces

Health-RI Nationale Gezondheidsdata-infrastructuur

Overkoepelende verhaallijn onderzoek, beleid en innovatie

Fase 1: initiatie onderzoek en planning

Fase 2: onderzoeksvoorbereiding

Fase 3: onderzoeksuitvoering

Fase 4: onderzoekspublicatie

Fase 5: onderzoeksafsluiting