Overkoepelende verhaallijn onderzoek, beleid en innovatie
Naar aanleiding van feedback op de vorige versie van deze verhaallijn is in dit artikel de verhaallijn onderzoek, beleid en innovatie opnieuw beschreven.
In deze verhaallijn gaan we nu uit van de volgende typen onderzoek:
Een onderzoek dat nieuwe data verzamelt, verwerkt, analyseert en publiceert.
Een onderzoek dat nieuwe data verzamelt, combineert met bestaande data, analyses uitvoert en de resultaten publiceert.
Een onderzoek dat bestaande data verzamelt, verwerkt, analyseert en publiceert.
Er zijn er nog meer maar wat alle onderzoeken gemeen hebben is dat ze worden voorbereid en dat het onderzoek en de data uiteindelijk wordt gepubliceerd.
Dit artikel is geschreven mbv de context van de data life cycle (DLC) en de HORA bedrijfsprocessen onderzoek.
De overkoepelende verhaallijn is een essentiële cases, welke door de Nationale gezondheidsdata-infrastructuur voor onderzoek, beleid en innovatie ondersteund moet worden. Deze verhaallijn raakt vrijwel aan alle aspecten. Dit houdt in dat deze verhaallijn gedragen moet worden door de verschillende werkgroepen, die actief met de Health-RI wiki. Er is vanuit verschillende werkgroepen feedback geleverd op deze verhaallijn, die nog onderling afgestemd dient te worden. Deze feedback zal in de volgende versie worden meegenomen om dan tot een breed gedragen definitie te komen.
In dit artikel wordt de verhaallijn onderzoek, beleid en innovatie opgedeeld in 5 fases, in de beschrijving van de fases worden ze gerelateerd aan de HORA bedrijfsprocessen en data life cycle stadia.
DLC Stadium | Omschrijving | Actor |
Definiëren onderzoeksvraag en onderzoeksontwerp, ethische goedkeuring verkrijgen, opstellen datamanagementplan | Onderzoeker | |
Data verzamelen (zowel nieuwe data genereren als bestaande data aanvragen) | Onderzoeker | |
Opschoning en FAIRificatie van gegevens | Onderzoeker, datahouder | |
Uitvoeren van het onderzoek | Onderzoeker | |
Bewaren en archiveren van data | Onderzoeker, datahouder | |
Data voorbereiden en beschikbaar maken | Onderzoeker | |
Data beschikbaar maken voor andere onderzoekers | Onderzoeker |
Er zijn verschillende soorten onderzoek. In dit artikel onderscheiden we de volgende varianten.
Onderzoeksvarianten | Data life Cycle stadia | ||||||||
|
| Plan-nen | Verza-melen 1 data gene-reren | Verza-melen 2 data aanvragen | Verwer-ken door onder-zoeker | Verwerken door data houder | Analy-seren | Bewa-ren | Delen & Herge-bruiken |
A | Onderzoeker gaat data verzamelen met bv een EDC tool, de input verwerken en analyseren en het resultaat beschikbaar maken | Ja | Ja | Nee | Ja | Nee | Ja | Ja | Ja |
B | Onderzoeker gaat data verzamelen met een EDC tool, de input combineren met andere data, het geheel verwerken en analyseren en het resultaat beschikbaar maken | Ja | Ja | Ja | Ja | Ja | Ja | Ja | Ja |
C | Onderzoeker gaat data verzamelen uit 1 of meerdere bronnen, analyses uitvoeren en het resultaat beschikbaar maken | Ja | Nee | Ja | Nee | Ja | Ja | Ja | Ja |
Fase 1: initiatie onderzoek en planning
Doel: mandaat krijgen voor de uitvoering van een onderzoek
HORA processen
opzetten onderzoekscollaboratie
opstellen onderzoeksvoorstel
werven onderzoeksmiddelen
DLC stadium
Plannen | Verzamelen | Verwerken | Analyseren | Bewaren | Delen en hergebruik |
---|---|---|---|---|---|
|
|
|
|
|
|
Trigger: een onderzoeker heeft een onderzoeksvraag en wil een onderzoek uitvoeren.
De onderzoeker maakt een onderzoeksvoorstel met daarin (evt met onderzoekspartners) de onderdelen
een onderzoeksopzet
een onderzoeksplan
een onderzoeksvraag
de benodigde resources
een eerste opzet van een datamanagementplan met daarin o.a.
de te gebruiken databronnen
de te gebruiken codetabellen en metadata sjablonen (voorgeschreven door een data-governancecommissie)
een beschrijving van de benodigde onderzoeksomgeving en aanvullende gereedschappen
indien van toepassing, zeggenschap van -voor het onderzoek geschikte- datasubjects
De onderzoeker identificeert de te gebruiken bronnen voor het onderzoek (via Verhaallijn: Data zoeken in metadata)
de onderzoeker zoekt in de catalogus naar geschikte bronnen
de onderzoeker filtert de resultaten desgewenst om tot een nauwkeuriger resultaat te komen
indien nodig om de benodigde gegevens te vinden identificeert de onderzoeker zich bij de catalogus
om te verifiëren dat de gegevens geschikt zijn kan de onderzoeker direct vragen stellen aan de data-aanbieder
de onderzoeker neemt de identifiers van geschikte en te gebruiken bronnen over in het projectvoorstel en data management plan.
De onderzoeker maakt een financieringsaanvraag voor het onderzoeksvoorstel en dient dat in bij een funder indien van toepassing.
De funder beoordeelt de aanvraag en geeft een akkoord.
De onderzoeker rondt het onderzoeksvoorstel af en dient het (bij de lokale toetsingscommissie onderzoek) in voor toetsing. De toetsing kan omvatten:
een juridische toetsing
een ethische toetsing
een toetsing op maatschappelijke aspecten
een toetsing door een Technology Transfer Office
De lokale toetsingscommissie onderzoek beoordeelt het onderzoeksvoorstel zelf, laat de benodigde toetsingen uitvoeren en geeft -als die allemaal ook akkoord gaan- een akkoord op het onderzoeksvoorstel.
Mijlpaalproducten:
goedgekeurd onderzoeksvoorstel
eerste opzet datamanagementplan
financiële dekking voor het onderzoek
Fase 2: onderzoeksvoorbereiding
Doel: alle onderdelen prepareren voor de uitvoering van het onderzoek
HORA processen
(her)gebruiken onderzoeksgegevens
DLC stadium
Plannen | Verzamelen | Verwerken | Analyseren | Bewaren | Delen en hergebruik |
---|---|---|---|---|---|
|
|
|
|
|
|
Trigger: het onderzoeksvoorstel is goedgekeurd.
Variant A: de onderzoeker gaat nieuwe data verzamelen, verwerken en analyseren
De onderzoeker doet een aanvraag voor een onderzoeksomgeving en aanvullende gereedschappen bij de gereedschapsleverancier om:
een data managementplan te onderhouden voor herbruikbare onderzoeksresultaten
de zeggenschap van de burger (informed consent / opt-out) vast te leggen
data te genereren en beheren
De leverancier stelt de onderzoeksomgeving en de aanvullende gereedschappen ter beschikking aan de onderzoeker.
De onderzoeker configureert de aanvullende gereedschappen naar wens (de onderzoeker ontwerpt bv een ECRF (Electronisch Case Report Form) om data te verzamelen).
De onderzoeker vult het Data management plan aan, gebruik makend van codetabellen en metadata templates die zijn voorgeschreven door de data-governancecommissie
De Lokale datatoegangscommissie van de betreffende datahouder geeft aan onder welke gebruiksvoorwaarden data bij de databron vastgelegd mag worden t.b.v. meervoudig gebruik.
Variant B en C: de onderzoeker heeft voor het onderzoek bestaande data nodig. De onderzoeker doet een aanvraag om de voor het onderzoek te gebruiken bronnen ter beschikking te stellen (Verhaallijn: Data aanvragen)
de onderzoeker logt in op het Nationale Gezondheidsportaal en vult een aanvraagformulier in voor de beoogde bronnen onder vermelding van:
Identiteit van de beoogde datagebruiker(s)
Vermelding van de gewenste datasets respectievelijk de data-aanbieders
De onderzoeksopzet en de rationale (waaronder bijvoorbeeld de duur van het onderzoek) voor het gebruik van de gewenste datasets
De gewenste analyse op de gewenste datasets icm evt andere voor de analyse benodigde data
Toe te passen veilige verwerkingsomgeving en aanvullende gereedschappen mbv de Gereedschapsleverancier
Goedkeuring van de lokale toetsingscommissie onderzoek
De data-aanvraagdienst faciliteert en administreert het proces voor de datagebruiker om geselecteerde dataset(s) aan te vragen bij de centrale datatoegangscommissie.
De centrale datatoegangscommissie verifieert of de aanvraag compleet is en of de gewenste uit te voeren analyse voldoet aan de gebruiksvoorwaarden van de aangevraagde dataset(s).
De data-aanvraagdienst registreert het antwoord van de centrale datatoegangscommissie en faciliteert en administreert het proces voor de datagebruiker om geselecteerde dataset(s) aan te vragen bij de data-aanbieder(s).
De benaderde data-aanbieder verifieert:
dat de aanvraag voldoet aan de geldende gebruiksvoorwaarden van de aangevraagde data
dat er geen veto is van de lokale datatoegangscommissie op de aanvraag
en legt het resultaat van de beoordeling vast bij de data-aanvraagdienst
De data-aanvraagdienst koppelt het resultaat van de beoordelingen terug naar de datagebruiker.
De data-aanvraagdienst verstuurt de contracten (bv data access agreements) naar betrokken partijen.
De betrokken partijen ondertekenen de contracten.
Na ondertekening van de contracten stuurt de data-aanvraagdienst een notificatie naar de data-aanbieder(s) dat de data beschikbaar gemaakt kan worden op de aangevraagde veilige verwerkingsomgeving of beschikbaar gemaakt kan worden tbv een gefedereerde analyse.
De leverancier veilige verwerkingsomgeving installeert en configureert de gewenste veilige verwerkingsomgeving met de gewenste gereedschappen zoals de data-gebruiker dat in zijn aanvraag heeft verzocht.
Iedere data-aanbieder stelt de aangevraagde data ter beschikking (Verhaallijn: Data-uitgifte na aanvraag)
op de gewenste veilige verwerkingsomgeving (voor de duur van het onderzoek zoals is overeengekomen in de data-aanvraag dan wel wettelijk is vastgesteld).
De data-aanbieder minimaliseert de dataset.
De data-aanbieder raadpleegt het zeggenschapsregister om data te onderdrukken waarvoor geen toestemming is gegeven of waar bezwaar tegen is gemaakt (indien nodig).
De data-aanbieder voert (indien nodig) een pseudonimisering (door middel van de generieke dienst pseudomiseringsdienst) uit op de aangevraagde dataset.
De data-aanbieder maakt de data beschikbaar ten behoeve van de gewenste veilige verwerkingsomgeving.
De data-aanbieder meldt aan de localisatiedienst welke data voor welk onderzoek ter beschikking zijn gesteld
De data-aanbieder meldt aan de data-aanvraagdienst dat de gewenste dataset ter beschikking is gesteld zodat de status van aanvraag kan worden bijgewerkt
De data-aanbieder borgt de reproduceerbaarheid van de dataset, bv om de data-uitgifte op een later tijdstip te kunnen herhalen.
ten behoeve van een gefedereerde analyse
Iedere bij deze gefedereerde analyse betrokken data-aanbieder minimaliseert de dataset.
Iedere bij deze gefedereerde analyse betrokken data-aanbieder raadpleegt het zeggenschapsregister om data te onderdrukken waarvoor geen passende zeggenschap is (indien nodig).
Iedere bij deze gefedereerde analyse betrokken data-aanbieder voert de gewenste, dan wel vereiste pseudonimisering (door middel van de generieke dienst pseudonimiseringsdienst) uit op de aangevraagde dataset.
Iedere bij deze gefedereerde analyse betrokken data-aanbieder maakt de data beschikbaar voor levering aan de voor deze gefedereerde analyse aangewezen data processor.
Iedere bij deze gefedereerde analyse betrokken data-aanbieder meldt aan de localisatiedienst welke gegevens voor welk onderzoek ter beschikking zijn gesteld.
Iedere bij deze gefedereerde analyse betrokken data-aanbieder meldt aan de data-aanvraagdienst dat de gewenste dataset ter beschikking is gesteld zodat de status van aanvraag kan worden bijgewerkt.
Iedere bij deze gefedereerde analyse betrokken data-aanbieder borgt de reproduceerbaarheid van de dataset, bv om de data-uitgifte op een later tijdstip te kunnen herhalen.
Mijlpaalproducten:
een veilige verwerkingsomgeving
geïnstalleerde tools
ter beschikking gestelde dataset
bijgewerkte localisatiegegevens
gearchiveerde dataset
een aangepast datamanagementplan
Fase 3: onderzoeksuitvoering
Doel: komen tot onderzoeksresultaten
HORA processen
creëren nieuwe onderzoeksgegevens
verwerken en analyseren onderzoeksgegevens
produceren onderzoeksresultaten
DLC stadium
Plannen | Verzamelen | Verwerken | Analyseren | Bewaren | Delen en hergebruik |
---|---|---|---|---|---|
|
|
|
|
|
|
Trigger: er is een bericht dat de aangevraagde data en/of de onderzoeksomgeving beschikbaar is (indien van toepassing)
Variant A: Nieuwe onderzoeksdata genereren en verwerken/analyseren ( https://health-ri.atlassian.net/wiki/spaces/BWV2/pages/249071826)
31. De databron begint met het genereren van nieuwe datapunten.
Wanneer de data gegenereerd is dan ontvangt de datagebruiker de gegenereerde data.
De datagebruiker gebruikt de gereedschappen op de onderzoeksomgeving om de gegenereerde data verder te verwerken en te analyseren.
Variant B: Nieuwe onderzoeksdata genereren en combineren met aangevraagde data (Verhaallijn: Centraal analyseren)
31. De databron begint met het genereren van nieuwe datapunten.
Wanneer de data gegenereerd is dan ontvangt de datagebruiker de gegenereerde data.
De datagebruiker gebruikt de gereedschappen op de onderzoeksomgeving om de gegenereerde data verder te verder te verwerken en te analyseren.
De datagebruiker combineert de gegenereerde data met aangevraagde data: het resultaat is de invoerdata voor de verdere analyse.
De datagebruiker geeft de onderzoeksomgeving opdracht om de door de datagebruiker vastgestelde en goedgekeurde analyse uit te voeren op de invoerdata.
De veilige verwerkingsomgeving voert de door de datagebruiker vastgestelde en goedgekeurde analyse uit op de invoerdata.
De datagebruiker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of nu worden vastgelegd in het data managementplan om de definitieve onderzoeksresultaten te genereren.
Variant C: Aangevraagde data analyseren (Verhaallijn: Centraal analyseren)
De datagebruiker geeft de onderzoeksomgeving opdracht om de door de datagebruiker vastgestelde en goedgekeurde analyse uit te voeren op de invoerdata.
De veilige verwerkingsomgeving voert de door de datagebruiker vastgestelde en goedgekeurde analyse uit op de invoerdata.
De datagebruiker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of nu worden vastgelegd in het data managementplan om de definitieve onderzoeksresultaten te genereren.
Mijlpaalproducten:
dataset met onderzoeksresultaten
metadata van de dataset met onderzoeksresultaten
ontwikkelde/ getrainde algoritmen (optioneel)
analyse scripts of software code
Fase 4: onderzoekspublicatie
Doel: uitgeven van een manuscript en beschikbaar stellen van de onderzoeksresultaten.
HORA processen:
dissemineren onderzoeksresultaten
preserveren onderzoeksresultaten en onderzoeksgegevens
waarborgen vindbaarheid onderzoeksgegevens
waarborgen toegankelijkheid onderzoeksgegevens
waarborgen herbruikbaarheid onderzoeksgegevens
DLC stadium
Plannen | Verzamelen | Verwerken | Analyseren | Bewaren | Delen en hergebruik |
---|---|---|---|---|---|
|
|
|
|
|
|
Trigger: het onderzoek is afgerond en er zijn onderzoeksresultaten om te publiceren
De onderzoeker acteert hier in de rol van data-aanbieder. Een aantal activiteiten kunnen ook worden uitgevoerd door het onderzoeksinstituut.
De onderzoeker publiceert de conclusies en resultaten in een manuscript.
De onderzoeker zorgt ervoor dat de onderzoeksdata en onderzoeksresultaten gearchiveerd worden.
De onderzoeker vraagt aan de Lokale datatoegangscommissie of en onder welke gebruiksvoorwaarden de onderzoeksresultaten vastgelegd mogen worden t.b.v. meervoudig gebruik.
De Lokale datatoegangscommissie van betreffende datahouder geeft aan onder welke gebruiksvoorwaarden de onderzoeksresultaten vastgelegd mogen worden t.b.v. meervoudig gebruik.
De onderzoeker maakt gebruik van codetabellen en metadatasjablonen die zijn voorgeschreven door de data-governancecommissie en die al zijn of worden vastgelegd in het data managementplan om de onderzoeksresultaten geschikt te maken voor meervoudig gebruik (optioneel).
De onderzoeker documenteert de dataset met onderzoeksresultaten en maakt de dataset beschikbaar.
De onderzoeker notificeert de localisatiedienst indien nodig over de gepubliceerde data.
De onderzoeker maakt een actueel metadatabestand over de onderzoeksresultaten dataset en registreert en publiceert de metadata bij een FAIR data point naar keuze, mbv een losse applicatie of geïntegreerd in een applicatie met data-repository of metadata-catalogus functionaliteit.
De onderzoeker meldt het gebruikte FAIR data point bij een FAIR data point register (zie bv FAIR Data Point) aan als dat nog niet eerder is gedaan. Het is de verantwoordelijkheid van de catalogus om regelmatig en/of getriggerd door een zoekopdracht de laatste stand van zaken van de metadata op te halen bij de FAIR data points.
Mijlpaalproducten:
manuscript
gepubliceerde onderzoeksresultaten dataset
op een FDP gepubliceerde metadata
gepubliceerde workflows en/of algoritmen (optioneel)
Fase 5: onderzoeksafsluiting
Doel: het formeel afsluiten van het onderzoek en opruimen van de gebruikte data en omgeving
HORA processen
archiveren onderzoeksresultaten
DLC stadium
Plannen | Verzamelen | Verwerken | Analyseren | Bewaren | Delen en hergebruik |
---|---|---|---|---|---|
|
|
|
|
|
|
Trigger: het onderzoek is afgerond en de onderzoeksresultaten zijn gepubliceerd
De onderzoeker zorgt ervoor dat de onderzoeksdata, onderzoeksresultaten en de documentatie gearchiveerd worden.
De onderzoeker richt het beheer van de onderzoeksresultaten dataset en de metadata van de dataset in
De onderzoeker zorgt ervoor dat de onderzoeksomgeving, de onderzoeksdata en onderzoeksresultaten opgeruimd worden.
Mijlpaalproducten:
gearchiveerde data en documentatie
ingericht data beheerproces