Health-RI wiki v4.0 -> consultatie (open tot 03-12-2024)


Overkoepelende verhaallijn onderzoek, beleid en innovatie

Naar aanleiding van feedback op de vorige versie van deze verhaallijn is in dit artikel de verhaallijn onderzoek, beleid en innovatie opnieuw beschreven.

In deze verhaallijn gaan we nu uit van de volgende varianten:

  • Variant A: een onderzoek dat nieuwe data verzamelt, verwerkt, analyseert en publiceert

  • Variant B: een onderzoek dat nieuwe data verzamelt, combineert met bestaande data, analyses uitvoert en de resultaten publiceert.

  • Variant C: een onderzoek dat bestaande data verzamelt, verwerkt, analyseert en publiceert.

Er zijn er nog meer maar wat alle onderzoeken gemeen hebben is dat ze worden voorbereid en dat het onderzoek en de data uiteindelijk wordt gepubliceerd.

In dit artikel wordt de verhaallijn onderzoek, beleid en innovatie opgedeeld in 5 fases. In de beschrijving van de fases worden ze gerelateerd aan de HORA bedrijfsprocessen onderzoek en data life cycle (DLC) stadia. Zie Context overkoepelende verhaallijn onderzoek, beleid en innovatie voor de context.

De overkoepelende verhaallijn is een essentiële cases, welke door de Nationale gezondheidsdata-infrastructuur voor onderzoek, beleid en innovatie ondersteund moet worden. Deze verhaallijn raakt vrijwel aan alle aspecten. Dit houdt in dat deze verhaallijn gedragen moet worden door de verschillende werkgroepen, die actief met de Health-RI wiki. Er is vanuit verschillende werkgroepen feedback geleverd op deze verhaallijn, die nog onderling afgestemd dient te worden. Deze feedback zal in de volgende versie worden meegenomen om dan tot een breed gedragen definitie te komen.

 

image-20241107-141938.png
Fases overkoepelende verhaallijn onderzoek
  1. Initiatie onderzoek en planning

  2. Onderzoeksvoorbereiding

  3. Onderzoeksuitvoering

  4. Onderzoekspublicatie

  5. Onderzoeksafsluiting

Fase 1: initiatie onderzoek en planning

Doel: toestemming krijgen voor de uitvoering van een onderzoek

HORA processen

  • opzetten onderzoekscollaboratie

  • opstellen onderzoeksvoorstel

  • werven onderzoeksmiddelen

DLC stadium

Plannen

Verzamelen

Verwerken

Analyseren

Bewaren

Delen en hergebruik

Plannen

Verzamelen

Verwerken

Analyseren

Bewaren

Delen en hergebruik

 

 

 

 

 

 

Trigger: een onderzoeker heeft een onderzoeksvraag en wil een onderzoek uitvoeren.

  1. De onderzoeker maakt een onderzoeksvoorstel met daarin (evt met onderzoekspartners) de onderdelen

    1. een onderzoeksvraag

    2. een onderzoeksplan

    3. een onderzoeksopzet

    4. de benodigde resources

    5. een eerste opzet van een datamanagementplan met daarin o.a.

      1. de te gebruiken databronnen

      2. de te gebruiken codetabellen en metadata sjablonen (voorgeschreven door een data-governancecommissie)

    6. een beschrijving van de benodigde onderzoeksomgeving, aanvullende gereedschappen en de vereisten qua data-opslag.

    7. indien van toepassing, zeggenschap van -voor het onderzoek geschikte- datasubjects

  2. De onderzoeker identificeert de te gebruiken bronnen voor het onderzoek (via Verhaallijn: Data zoeken in metadata)

    1. de onderzoeker zoekt in de catalogus naar geschikte bronnen

    2. de onderzoeker filtert de resultaten desgewenst om tot een nauwkeuriger resultaat te komen

    3. indien nodig om de benodigde gegevens te vinden identificeert de onderzoeker zich bij de catalogus

    4. om te verifiëren dat de gegevens geschikt zijn kan de onderzoeker direct vragen stellen aan de data-aanbieder

    5. de onderzoeker neemt de identifiers van geschikte en te gebruiken bronnen over in het projectvoorstel en data management plan.

  3. De onderzoeker dient het onderzoeksvoorstel in bij de lokale toetsingscommissie onderzoek van het instituut voor een interne review.

  4. De lokale toetsingscommissie onderzoek beoordeelt het onderzoeksvoorstel en en geeft een akkoord (mogelijk na hoor en wederhoor).

  5. De onderzoeker maakt een financieringsaanvraag voor het onderzoeksvoorstel en dient dat in bij een funder indien van toepassing.

  6. De funder beoordeelt de aanvraag en geeft een akkoord (mogelijk na hoor en wederhoor).

  7. De onderzoeker dient het onderzoeksvoorstel in bij een toetsingscommissie voor toetsing. De toetsing kan omvatten:

    1. een juridische toetsing

    2. een ethische toetsing

    3. een toetsing op maatschappelijke aspecten

  8. De toetsingscommissie beoordeelt het onderzoeksvoorstel en geeft een akkoord (mogelijk na hoor -en wederhoor).

  9. De onderzoeker registreert het goedgekeurde onderzoeksvoorstel en onderliggende stukken in een interne catalogus.

Mijlpaalproducten:

  • goedgekeurd onderzoeksvoorstel

  • eerste opzet datamanagementplan

  • financiële dekking voor het onderzoek

  • consortium gevormd

Fase 2: onderzoeksvoorbereiding

Doel: alle onderdelen prepareren voor de uitvoering van het onderzoek

HORA processen

  • (her)gebruiken onderzoeksgegevens

DLC stadium

Plannen

Verzamelen

Verwerken

Analyseren

Bewaren

Delen en hergebruik

Plannen

Verzamelen

Verwerken

Analyseren

Bewaren

Delen en hergebruik

 

 

 

 

 

 

Trigger: het onderzoeksvoorstel is goedgekeurd.

Variant A: de onderzoeker gaat nieuwe data verzamelen, verwerken en analyseren

  1. De onderzoeker doet een aanvraag voor een onderzoeksomgeving en aanvullende gereedschappen bij de gereedschapsleverancier om:

    1. een data managementplan te onderhouden voor herbruikbare onderzoeksresultaten

    2. de zeggenschap van de burger (informed consent / opt-out) vast te leggen

    3. data te genereren en beheren

  2. De leverancier stelt de onderzoeksomgeving en de aanvullende gereedschappen ter beschikking aan de onderzoeker.

  3. De onderzoeker vult het Data management plan aan, gebruik makend van codetabellen en metadata templates die zijn voorgeschreven door de data-governancecommissie

  4. De onderzoeker configureert de aanvullende gereedschappen (de onderzoeker ontwerpt bv een ECRF (Electronisch Case Report Form) om data te verzamelen).

  5. De Lokale datatoegangscommissie van de betreffende datahouder geeft aan onder welke gebruiksvoorwaarden data bij de databron vastgelegd mag worden t.b.v. meervoudig gebruik.

Variant B en C: de onderzoeker heeft voor het onderzoek bestaande data nodig. De onderzoeker doet een aanvraag om toegang te krijgen tot de voor het onderzoek te gebruiken bronnen (https://health-ri.atlassian.net/wiki/spaces/HA/pages/84738895

  1. De datagebruiker selecteert (een subset van) één of meerdere datasets uit de geaggregeerde set van metadata van de catalogus.

  2. De datagebruiker legt een datagebruik-aanvraag vast met

    1. Identificatie en authenticatie van de datagebruiker(s)

    2. Vermelding van de gewenste datasets respectievelijk de data-aanbieders

    3. De onderzoeksopzet en de rationale (waaronder bijvoorbeeld de duur van het onderzoek) voor het gebruik van de gewenste datasets

    4. De gewenste analyse op de gewenste datasets in combinatie met eventueel andere voor de analyse benodigde data

    5. Toe te passen veilige verwerkingsomgeving (en gereedschappen m.b.v. de gereedschapsleverancier)

    6. De benodigde opslagcapaciteit tbv analyse en archivering tijdens het onderzoek

    7. Goedkeuring van de lokale toetsingscommissie onderzoek

  3. De datagebruik-aanvraag wordt beoordeeld door een of meerdere datatoegangscommissies.

  4. Na beoordeling van de gebruiksvoorwaarden van de dataset(s) en de gegevens in de data-aanvraag wordt een data-toegangsvergunning verleend.

  5. Een data-aanbieder stelt een contract op en biedt dat aan aan de indiener van de datagebruik-aanvraag

  6. De indiener van de datagebruik-aanvraag tekent het contract

  7. Na ondertekening van het contract maakt de data-aanbieder de aangevraagde data beschikbaar voor de datagebruiker volgens de (contractueel) overeengekomen voorwaarden.

  8. De leverancier veilige verwerkingsomgeving installeert en configureert de gewenste veilige verwerkingsomgeving met de gewenste gereedschappen zoals de data-gebruiker dat in de aanvraag heeft verzocht.

  9. Iedere data-aanbieder stelt de aangevraagde data ter beschikking (Verhaallijn: Toegang verlenen tot data)

    1. op de gewenste veilige verwerkingsomgeving (voor de duur van het onderzoek zoals is overeengekomen in de data-aanvraag dan wel wettelijk is vastgesteld).

      1. De data-aanbieder minimaliseert de dataset.

      2. De data-aanbieder raadpleegt het zeggenschapsregister om data te onderdrukken waarvoor geen toestemming is gegeven of waar bezwaar tegen is gemaakt (indien nodig).

      3. De data-aanbieder voert (indien nodig) een pseudonimisering (door middel van de generieke dienst pseudomiseringsdienst) uit op de aangevraagde dataset.

      4. De data-aanbieder maakt de data beschikbaar ten behoeve van de gewenste veilige verwerkingsomgeving.

      5. De data-aanbieder meldt aan de localisatiedienst welke data voor welk onderzoek ter beschikking zijn gesteld

      6. De data-aanbieder meldt aan de data-aanvraagdienst dat de gewenste dataset ter beschikking is gesteld zodat de status van aanvraag kan worden bijgewerkt

      7. De data-aanbieder borgt de reproduceerbaarheid van de dataset, bv om de data-uitgifte op een later tijdstip te kunnen herhalen.

       

    2. ten behoeve van een gefedereerde analyse

      1. Iedere bij deze gefedereerde analyse betrokken data-aanbieder minimaliseert de dataset.

      2. Iedere bij deze gefedereerde analyse betrokken data-aanbieder raadpleegt het zeggenschapsregister om data te onderdrukken waarvoor geen passende zeggenschap is (indien nodig).

      3. Iedere bij deze gefedereerde analyse betrokken data-aanbieder voert de gewenste, dan wel vereiste pseudonimisering (door middel van de generieke dienst pseudonimiseringsdienst) uit op de aangevraagde dataset.

      4. Iedere bij deze gefedereerde analyse betrokken data-aanbieder maakt de data beschikbaar voor levering aan de voor deze gefedereerde analyse aangewezen data processor.

      5. Iedere bij deze gefedereerde analyse betrokken data-aanbieder meldt aan de localisatiedienst welke gegevens voor welk onderzoek ter beschikking zijn gesteld.

      6. Iedere bij deze gefedereerde analyse betrokken data-aanbieder meldt aan de data-aanvraagdienst dat de gewenste dataset ter beschikking is gesteld zodat de status van aanvraag kan worden bijgewerkt.

      7. Iedere bij deze gefedereerde analyse betrokken data-aanbieder borgt de reproduceerbaarheid van de dataset, bv om de data-uitgifte op een later tijdstip te kunnen herhalen.

       

Mijlpaalproducten:

  • een veilige verwerkingsomgeving

  • geïnstalleerde tools

  • toegang tot de gevraagde data(set)

  • bijgewerkte localisatiegegevens

  • gearchiveerde dataset

  • een aangepast datamanagementplan

Fase 3: onderzoeksuitvoering

Doel: komen tot onderzoeksresultaten

HORA processen

  • creëren nieuwe onderzoeksgegevens

  • verwerken en analyseren onderzoeksgegevens

  • produceren onderzoeksresultaten

DLC stadium

Plannen

Verzamelen

Verwerken

Analyseren

Bewaren

Delen en hergebruik

Plannen

Verzamelen

Verwerken

Analyseren

Bewaren

Delen en hergebruik

 

 

 

 

 

 

Trigger: er is een bericht dat de aangevraagde data in de gevraagde onderzoeksomgeving beschikbaar is

Variant A: Nieuwe onderzoeksdata genereren en verwerken/analyseren ( https://health-ri.atlassian.net/wiki/spaces/BWV2/pages/249071826)

31. De databron begint met het genereren van nieuwe datapunten.

  1. Wanneer de data gegenereerd is dan ontvangt de datagebruiker de gegenereerde data.

  2. De datagebruiker gebruikt de gereedschappen op de onderzoeksomgeving om de gegenereerde data verder te verwerken en te analyseren.

Variant B: Nieuwe onderzoeksdata genereren en combineren met aangevraagde data (Verhaallijn: Centraal analyseren)

31. De databron begint met het genereren van nieuwe datapunten.

  1. Wanneer de data gegenereerd is dan ontvangt de datagebruiker de gegenereerde data.

  2. De datagebruiker gebruikt de gereedschappen op de onderzoeksomgeving om de gegenereerde data verder te verder te verwerken en te analyseren.

  3. De datagebruiker combineert de gegenereerde data met aangevraagde data: het resultaat is de invoerdata voor de verdere analyse.

  4. De datagebruiker geeft de onderzoeksomgeving opdracht om de door de datagebruiker vastgestelde en goedgekeurde analyse uit te voeren op de invoerdata.

  5. De veilige verwerkingsomgeving voert de door de datagebruiker vastgestelde en goedgekeurde analyse uit op de invoerdata.

  6. De datagebruiker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of nu worden vastgelegd in het data managementplan om de definitieve onderzoeksresultaten te genereren.

Variant C: Aangevraagde data analyseren (Verhaallijn: Centraal analyseren)

  1. De datagebruiker geeft de onderzoeksomgeving opdracht om de door de datagebruiker vastgestelde en goedgekeurde analyse uit te voeren op de invoerdata.

  2. De veilige verwerkingsomgeving voert de door de datagebruiker vastgestelde en goedgekeurde analyse uit op de invoerdata.

  3. De datagebruiker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of nu worden vastgelegd in het data managementplan om de definitieve onderzoeksresultaten te genereren.

Mijlpaalproducten:

  • dataset met onderzoeksresultaten

  • metadata van de dataset met onderzoeksresultaten

  • ontwikkelde/ getrainde algoritmen (optioneel)

  • analyse scripts of software code

Fase 4: onderzoekspublicatie

Doel: uitgeven van een manuscript en beschikbaar stellen van de onderzoeksresultaten.

HORA processen:

  • dissemineren onderzoeksresultaten

  • preserveren onderzoeksresultaten en onderzoeksgegevens

  • waarborgen vindbaarheid onderzoeksgegevens

  • waarborgen toegankelijkheid onderzoeksgegevens

  • waarborgen herbruikbaarheid onderzoeksgegevens

DLC stadium

Plannen

Verzamelen

Verwerken

Analyseren

Bewaren

Delen en hergebruik

Plannen

Verzamelen

Verwerken

Analyseren

Bewaren

Delen en hergebruik

 

 

 

 

 

 

Trigger: het onderzoek is afgerond en er zijn onderzoeksresultaten om te publiceren

De onderzoeker acteert hier in de rol van data-aanbieder. Een aantal activiteiten kunnen ook worden uitgevoerd door het onderzoeksinstituut.

  1. De onderzoeker publiceert de conclusies en resultaten in een manuscript.

  2. De onderzoeker zorgt ervoor dat de onderzoeksdata en onderzoeksresultaten gearchiveerd worden.

  3. De onderzoeker vraagt aan de Lokale datatoegangscommissie of en onder welke gebruiksvoorwaarden de onderzoeksdata en onderzoeksresultaten vastgelegd mogen worden t.b.v. meervoudig gebruik.

  4. De Lokale datatoegangscommissie van betreffende datahouder geeft aan onder welke gebruiksvoorwaarden de onderzoeksresultaten vastgelegd mogen worden t.b.v. meervoudig gebruik.

  5. De onderzoeker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of worden vastgelegd in het data managementplan om de onderzoeksresultaten geschikt te maken voor meervoudig gebruik (optioneel).

  6. De onderzoeker documenteert de dataset met onderzoeksresultaten en maakt de dataset beschikbaar.

  7. De onderzoeker notificeert de localisatiedienst indien nodig over de gepubliceerde data.

  8. De onderzoeker maakt een actueel metadatabestand over de onderzoeksresultaten dataset en registreert en publiceert de metadata bij een FAIR data point naar keuze, mbv een losse applicatie of geïntegreerd in een applicatie met data-repository of metadata-catalogus functionaliteit.

  9. De onderzoeker meldt het gebruikte FAIR data point bij een FAIR data point register (zie bv FAIR Data Point) aan als dat nog niet eerder is gedaan. Het is de verantwoordelijkheid van de catalogus om regelmatig en/of getriggerd door een zoekopdracht de laatste stand van zaken van de metadata op te halen bij de FAIR data points.

Mijlpaalproducten:

  • manuscript

  • gepubliceerde onderzoeksresultaten dataset

  • op een FDP gepubliceerde metadata

  • gepubliceerde workflows en/of algoritmen (optioneel)

Fase 5: onderzoeksafsluiting

Doel: het formeel afsluiten van het onderzoek en opruimen van de gebruikte data en omgeving

HORA processen

  • archiveren onderzoeksresultaten

DLC stadium

Plannen

Verzamelen

Verwerken

Analyseren

Bewaren

Delen en hergebruik

Plannen

Verzamelen

Verwerken

Analyseren

Bewaren

Delen en hergebruik

 

 

 

 

 

 

Trigger: het onderzoek is afgerond en de onderzoeksresultaten zijn gepubliceerd

  1. De onderzoeker zorgt ervoor dat de onderzoeksdata, onderzoeksresultaten en de documentatie gearchiveerd worden.

  2. De onderzoeker richt het beheer van de onderzoeksresultaten dataset en de metadata van de dataset in.

  3. De onderzoeker zorgt ervoor dat de onderzoeksomgeving, de onderzoeksdata en onderzoeksresultaten opgeruimd worden.

Mijlpaalproducten:

  • gearchiveerde data en documentatie

  • ingericht data beheerproces

 

 

Â