Health-RI wiki v4.0 -> consultatie (open tot 03-12-2024)
Overkoepelende verhaallijn onderzoek, beleid en innovatie
Naar aanleiding van feedback op de vorige versie van deze verhaallijn is in dit artikel de verhaallijn onderzoek, beleid en innovatie opnieuw beschreven.
In deze verhaallijn gaan we nu uit van de volgende varianten:
Variant A: een onderzoek dat nieuwe data verzamelt, verwerkt, analyseert en publiceert
Variant B: een onderzoek dat nieuwe data verzamelt, combineert met bestaande data, analyses uitvoert en de resultaten publiceert.
Variant C: een onderzoek dat bestaande data verzamelt, verwerkt, analyseert en publiceert.
Er zijn er nog meer maar wat alle onderzoeken gemeen hebben is dat ze worden voorbereid en dat het onderzoek en de data uiteindelijk wordt gepubliceerd.
In dit artikel wordt de verhaallijn onderzoek, beleid en innovatie opgedeeld in 5 fases. In de beschrijving van de fases worden ze gerelateerd aan de HORA bedrijfsprocessen onderzoek en data life cycle (DLC) stadia. Zie Context overkoepelende verhaallijn onderzoek, beleid en innovatie voor de context.
De overkoepelende verhaallijn is een essentiële cases, welke door de Nationale gezondheidsdata-infrastructuur voor onderzoek, beleid en innovatie ondersteund moet worden. Deze verhaallijn raakt vrijwel aan alle aspecten. Dit houdt in dat deze verhaallijn gedragen moet worden door de verschillende werkgroepen, die actief met de Health-RI wiki. Er is vanuit verschillende werkgroepen feedback geleverd op deze verhaallijn, die nog onderling afgestemd dient te worden. Deze feedback zal in de volgende versie worden meegenomen om dan tot een breed gedragen definitie te komen.
Â
Fase 1: initiatie onderzoek en planning
Doel: toestemming krijgen voor de uitvoering van een onderzoek
HORA processen
opzetten onderzoekscollaboratie
opstellen onderzoeksvoorstel
werven onderzoeksmiddelen
DLC stadium
Plannen | Verzamelen | Verwerken | Analyseren | Bewaren | Delen en hergebruik |
---|---|---|---|---|---|
 |  |  |  |  |  |
Trigger: een onderzoeker heeft een onderzoeksvraag en wil een onderzoek uitvoeren.
De onderzoeker maakt een onderzoeksvoorstel met daarin (evt met onderzoekspartners) de onderdelen
een onderzoeksvraag
een onderzoeksplan
een onderzoeksopzet
de benodigde resources
een eerste opzet van een datamanagementplan met daarin o.a.
de te gebruiken databronnen
de te gebruiken codetabellen en metadata sjablonen (voorgeschreven door een data-governancecommissie)
een beschrijving van de benodigde onderzoeksomgeving, aanvullende gereedschappen en de vereisten qua data-opslag.
indien van toepassing, zeggenschap van -voor het onderzoek geschikte- datasubjects
De onderzoeker identificeert de te gebruiken bronnen voor het onderzoek (via Verhaallijn: Data zoeken in metadata)
de onderzoeker zoekt in de catalogus naar geschikte bronnen
de onderzoeker filtert de resultaten desgewenst om tot een nauwkeuriger resultaat te komen
indien nodig om de benodigde gegevens te vinden identificeert de onderzoeker zich bij de catalogus
om te verifiëren dat de gegevens geschikt zijn kan de onderzoeker direct vragen stellen aan de data-aanbieder
de onderzoeker neemt de identifiers van geschikte en te gebruiken bronnen over in het projectvoorstel en data management plan.
De onderzoeker dient het onderzoeksvoorstel in bij de lokale toetsingscommissie onderzoek van het instituut voor een interne review.
De lokale toetsingscommissie onderzoek beoordeelt het onderzoeksvoorstel en en geeft een akkoord (mogelijk na hoor en wederhoor).
De onderzoeker maakt een financieringsaanvraag voor het onderzoeksvoorstel en dient dat in bij een funder indien van toepassing.
De funder beoordeelt de aanvraag en geeft een akkoord (mogelijk na hoor en wederhoor).
De onderzoeker dient het onderzoeksvoorstel in bij een toetsingscommissie voor toetsing. De toetsing kan omvatten:
een juridische toetsing
een ethische toetsing
een toetsing op maatschappelijke aspecten
De toetsingscommissie beoordeelt het onderzoeksvoorstel en geeft een akkoord (mogelijk na hoor -en wederhoor).
De onderzoeker registreert het goedgekeurde onderzoeksvoorstel en onderliggende stukken in een interne catalogus.
Mijlpaalproducten:
goedgekeurd onderzoeksvoorstel
eerste opzet datamanagementplan
financiële dekking voor het onderzoek
consortium gevormd
Fase 2: onderzoeksvoorbereiding
Doel: alle onderdelen prepareren voor de uitvoering van het onderzoek
HORA processen
(her)gebruiken onderzoeksgegevens
DLC stadium
Plannen | Verzamelen | Verwerken | Analyseren | Bewaren | Delen en hergebruik |
---|---|---|---|---|---|
 |  |  |  |  |  |
Trigger: het onderzoeksvoorstel is goedgekeurd.
Variant A: de onderzoeker gaat nieuwe data verzamelen, verwerken en analyseren
De onderzoeker doet een aanvraag voor een onderzoeksomgeving en aanvullende gereedschappen bij de gereedschapsleverancier om:
een data managementplan te onderhouden voor herbruikbare onderzoeksresultaten
de zeggenschap van de burger (informed consent / opt-out) vast te leggen
data te genereren en beheren
De leverancier stelt de onderzoeksomgeving en de aanvullende gereedschappen ter beschikking aan de onderzoeker.
De onderzoeker vult het Data management plan aan, gebruik makend van codetabellen en metadata templates die zijn voorgeschreven door de data-governancecommissie
De onderzoeker configureert de aanvullende gereedschappen (de onderzoeker ontwerpt bv een ECRF (Electronisch Case Report Form) om data te verzamelen).
De Lokale datatoegangscommissie van de betreffende datahouder geeft aan onder welke gebruiksvoorwaarden data bij de databron vastgelegd mag worden t.b.v. meervoudig gebruik.
Variant B en C: de onderzoeker heeft voor het onderzoek bestaande data nodig. De onderzoeker doet een aanvraag om toegang te krijgen tot de voor het onderzoek te gebruiken bronnen (https://health-ri.atlassian.net/wiki/spaces/HA/pages/84738895
De datagebruiker selecteert (een subset van) één of meerdere datasets uit de geaggregeerde set van metadata van de catalogus.
De datagebruiker legt een datagebruik-aanvraag vast met
Identificatie en authenticatie van de datagebruiker(s)
Vermelding van de gewenste datasets respectievelijk de data-aanbieders
De onderzoeksopzet en de rationale (waaronder bijvoorbeeld de duur van het onderzoek) voor het gebruik van de gewenste datasets
De gewenste analyse op de gewenste datasets in combinatie met eventueel andere voor de analyse benodigde data
Toe te passen veilige verwerkingsomgeving (en gereedschappen m.b.v. de gereedschapsleverancier)
De benodigde opslagcapaciteit tbv analyse en archivering tijdens het onderzoek
Goedkeuring van de lokale toetsingscommissie onderzoek
De datagebruik-aanvraag wordt beoordeeld door een of meerdere datatoegangscommissies.
Na beoordeling van de gebruiksvoorwaarden van de dataset(s) en de gegevens in de data-aanvraag wordt een data-toegangsvergunning verleend.
Een data-aanbieder stelt een contract op en biedt dat aan aan de indiener van de datagebruik-aanvraag
De indiener van de datagebruik-aanvraag tekent het contract
Na ondertekening van het contract maakt de data-aanbieder de aangevraagde data beschikbaar voor de datagebruiker volgens de (contractueel) overeengekomen voorwaarden.
De leverancier veilige verwerkingsomgeving installeert en configureert de gewenste veilige verwerkingsomgeving met de gewenste gereedschappen zoals de data-gebruiker dat in de aanvraag heeft verzocht.
Iedere data-aanbieder stelt de aangevraagde data ter beschikking (Verhaallijn: Toegang verlenen tot data)
op de gewenste veilige verwerkingsomgeving (voor de duur van het onderzoek zoals is overeengekomen in de data-aanvraag dan wel wettelijk is vastgesteld).
De data-aanbieder minimaliseert de dataset.
De data-aanbieder raadpleegt het zeggenschapsregister om data te onderdrukken waarvoor geen toestemming is gegeven of waar bezwaar tegen is gemaakt (indien nodig).
De data-aanbieder voert (indien nodig) een pseudonimisering (door middel van de generieke dienst pseudomiseringsdienst) uit op de aangevraagde dataset.
De data-aanbieder maakt de data beschikbaar ten behoeve van de gewenste veilige verwerkingsomgeving.
De data-aanbieder meldt aan de localisatiedienst welke data voor welk onderzoek ter beschikking zijn gesteld
De data-aanbieder meldt aan de data-aanvraagdienst dat de gewenste dataset ter beschikking is gesteld zodat de status van aanvraag kan worden bijgewerkt
De data-aanbieder borgt de reproduceerbaarheid van de dataset, bv om de data-uitgifte op een later tijdstip te kunnen herhalen.
Â
ten behoeve van een gefedereerde analyse
Iedere bij deze gefedereerde analyse betrokken data-aanbieder minimaliseert de dataset.
Iedere bij deze gefedereerde analyse betrokken data-aanbieder raadpleegt het zeggenschapsregister om data te onderdrukken waarvoor geen passende zeggenschap is (indien nodig).
Iedere bij deze gefedereerde analyse betrokken data-aanbieder voert de gewenste, dan wel vereiste pseudonimisering (door middel van de generieke dienst pseudonimiseringsdienst) uit op de aangevraagde dataset.
Iedere bij deze gefedereerde analyse betrokken data-aanbieder maakt de data beschikbaar voor levering aan de voor deze gefedereerde analyse aangewezen data processor.
Iedere bij deze gefedereerde analyse betrokken data-aanbieder meldt aan de localisatiedienst welke gegevens voor welk onderzoek ter beschikking zijn gesteld.
Iedere bij deze gefedereerde analyse betrokken data-aanbieder meldt aan de data-aanvraagdienst dat de gewenste dataset ter beschikking is gesteld zodat de status van aanvraag kan worden bijgewerkt.
Iedere bij deze gefedereerde analyse betrokken data-aanbieder borgt de reproduceerbaarheid van de dataset, bv om de data-uitgifte op een later tijdstip te kunnen herhalen.
Â
Mijlpaalproducten:
een veilige verwerkingsomgeving
geïnstalleerde tools
toegang tot de gevraagde data(set)
bijgewerkte localisatiegegevens
gearchiveerde dataset
een aangepast datamanagementplan
Fase 3: onderzoeksuitvoering
Doel: komen tot onderzoeksresultaten
HORA processen
creëren nieuwe onderzoeksgegevens
verwerken en analyseren onderzoeksgegevens
produceren onderzoeksresultaten
DLC stadium
Plannen | Verzamelen | Verwerken | Analyseren | Bewaren | Delen en hergebruik |
---|---|---|---|---|---|
 |  |  |  |  |  |
Trigger: er is een bericht dat de aangevraagde data in de gevraagde onderzoeksomgeving beschikbaar is
Variant A: Nieuwe onderzoeksdata genereren en verwerken/analyseren ( https://health-ri.atlassian.net/wiki/spaces/BWV2/pages/249071826)
31. De databron begint met het genereren van nieuwe datapunten.
Wanneer de data gegenereerd is dan ontvangt de datagebruiker de gegenereerde data.
De datagebruiker gebruikt de gereedschappen op de onderzoeksomgeving om de gegenereerde data verder te verwerken en te analyseren.
Variant B: Nieuwe onderzoeksdata genereren en combineren met aangevraagde data (Verhaallijn: Centraal analyseren)
31. De databron begint met het genereren van nieuwe datapunten.
Wanneer de data gegenereerd is dan ontvangt de datagebruiker de gegenereerde data.
De datagebruiker gebruikt de gereedschappen op de onderzoeksomgeving om de gegenereerde data verder te verder te verwerken en te analyseren.
De datagebruiker combineert de gegenereerde data met aangevraagde data: het resultaat is de invoerdata voor de verdere analyse.
De datagebruiker geeft de onderzoeksomgeving opdracht om de door de datagebruiker vastgestelde en goedgekeurde analyse uit te voeren op de invoerdata.
De veilige verwerkingsomgeving voert de door de datagebruiker vastgestelde en goedgekeurde analyse uit op de invoerdata.
De datagebruiker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of nu worden vastgelegd in het data managementplan om de definitieve onderzoeksresultaten te genereren.
Variant C: Aangevraagde data analyseren (Verhaallijn: Centraal analyseren)
De datagebruiker geeft de onderzoeksomgeving opdracht om de door de datagebruiker vastgestelde en goedgekeurde analyse uit te voeren op de invoerdata.
De veilige verwerkingsomgeving voert de door de datagebruiker vastgestelde en goedgekeurde analyse uit op de invoerdata.
De datagebruiker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of nu worden vastgelegd in het data managementplan om de definitieve onderzoeksresultaten te genereren.
Mijlpaalproducten:
dataset met onderzoeksresultaten
metadata van de dataset met onderzoeksresultaten
ontwikkelde/ getrainde algoritmen (optioneel)
analyse scripts of software code
Fase 4: onderzoekspublicatie
Doel: uitgeven van een manuscript en beschikbaar stellen van de onderzoeksresultaten.
HORA processen:
dissemineren onderzoeksresultaten
preserveren onderzoeksresultaten en onderzoeksgegevens
waarborgen vindbaarheid onderzoeksgegevens
waarborgen toegankelijkheid onderzoeksgegevens
waarborgen herbruikbaarheid onderzoeksgegevens
DLC stadium
Plannen | Verzamelen | Verwerken | Analyseren | Bewaren | Delen en hergebruik |
---|---|---|---|---|---|
 |  |  |  |  |  |
Trigger: het onderzoek is afgerond en er zijn onderzoeksresultaten om te publiceren
De onderzoeker acteert hier in de rol van data-aanbieder. Een aantal activiteiten kunnen ook worden uitgevoerd door het onderzoeksinstituut.
De onderzoeker publiceert de conclusies en resultaten in een manuscript.
De onderzoeker zorgt ervoor dat de onderzoeksdata en onderzoeksresultaten gearchiveerd worden.
De onderzoeker vraagt aan de Lokale datatoegangscommissie of en onder welke gebruiksvoorwaarden de onderzoeksdata en onderzoeksresultaten vastgelegd mogen worden t.b.v. meervoudig gebruik.
De Lokale datatoegangscommissie van betreffende datahouder geeft aan onder welke gebruiksvoorwaarden de onderzoeksresultaten vastgelegd mogen worden t.b.v. meervoudig gebruik.
De onderzoeker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of worden vastgelegd in het data managementplan om de onderzoeksresultaten geschikt te maken voor meervoudig gebruik (optioneel).
De onderzoeker documenteert de dataset met onderzoeksresultaten en maakt de dataset beschikbaar.
De onderzoeker notificeert de localisatiedienst indien nodig over de gepubliceerde data.
De onderzoeker maakt een actueel metadatabestand over de onderzoeksresultaten dataset en registreert en publiceert de metadata bij een FAIR data point naar keuze, mbv een losse applicatie of geïntegreerd in een applicatie met data-repository of metadata-catalogus functionaliteit.
De onderzoeker meldt het gebruikte FAIR data point bij een FAIR data point register (zie bv FAIR Data Point) aan als dat nog niet eerder is gedaan. Het is de verantwoordelijkheid van de catalogus om regelmatig en/of getriggerd door een zoekopdracht de laatste stand van zaken van de metadata op te halen bij de FAIR data points.
Mijlpaalproducten:
manuscript
gepubliceerde onderzoeksresultaten dataset
op een FDP gepubliceerde metadata
gepubliceerde workflows en/of algoritmen (optioneel)
Fase 5: onderzoeksafsluiting
Doel: het formeel afsluiten van het onderzoek en opruimen van de gebruikte data en omgeving
HORA processen
archiveren onderzoeksresultaten
DLC stadium
Plannen | Verzamelen | Verwerken | Analyseren | Bewaren | Delen en hergebruik |
---|---|---|---|---|---|
 |  |  |  |  |  |
Trigger: het onderzoek is afgerond en de onderzoeksresultaten zijn gepubliceerd
De onderzoeker zorgt ervoor dat de onderzoeksdata, onderzoeksresultaten en de documentatie gearchiveerd worden.
De onderzoeker richt het beheer van de onderzoeksresultaten dataset en de metadata van de dataset in.
De onderzoeker zorgt ervoor dat de onderzoeksomgeving, de onderzoeksdata en onderzoeksresultaten opgeruimd worden.
Mijlpaalproducten:
gearchiveerde data en documentatie
ingericht data beheerproces
Â
Â
Â