Verhaallijn: Onderzoeksdata genereren

datum: 23-08-2024 Status: VASTGESTELD

Dit artikel beschrijft de verhaallijn Onderzoeksdata genereren.

In deze verhaallijn wordt beschreven hoe een databron nieuwe datapunten genereert tijdens een onderzoek. Na het aanvragen en configureren van een veilige verwerkingsomgeving, met daarin de benodigde software (bijvoorbeeld Castor of XNAT) ter beschikking gesteld, kan de datagebruiker beginnen met datageneratie. Voorbeelden van datageneratie zijn het laten invullen van vragenlijsten door burgers, het laten annoteren van beelden door experts, of het overnemen van data uit een EPD naar een EDC, of verkregen resultaten uit (centrale/gefedereerde) analyse(s). Na afronding van de datageneratie kan de nieuw gegenereerde data beschikbaar gemaakt worden binnen het Health-RI ecosysteem en gearchiveerd worden.

Opmerkingen

Het achterliggende idee van deze verhaallijn is dat onderzoekers makkelijker onderzoeksdata direct beschikbaar kunnen maken binnen het Health-RI ecosysteem, door de nieuwe data binnen het ecosysteem te genereren.
Dit artikel was al beschreven in de vorige versie van de wiki. In deze versie zijn bedrijfsobjecten toegevoegd, met de bedoeling dat de stappen in de verhaallijn duidelijker worden.

Preconditie

De onderzoeker heeft een goedgekeurd onderzoeksvoorstel waarin o.a. staat beschreven welke data op welke manier gegenereerd mag worden.

Procesmodel

De onderzoeker in de rol van databron selecteert bij de gereedschapsleverancier de in het onderzoeksvoorstel gespecificeerde (Data Capture-) tooling/gereedschap of brengt zijn/haar eigen gereedschap mee om:
1. een datamanagementplan op te stellen voor herbruikbare onderzoeksresultaten
2. de zeggenschap van de burger (informed consent / e-consent / opt-out) vast te leggen
3. data te genereren
4. data te beheren en cureren.
De Lokale datatoegangscommissie van de betreffende datahouder geeft aan onder welke gebruiksvoorwaarden data bij de databron vastgelegd mag worden t.b.v. meervoudig gebruik.
De databron legt deze gebruiksvoorwaarden vast in een datamanagementplan en definieert welke data op welke manier vastgelegd gaat worden, gebruik makend van codetabellen, metadata dictionaries en metadata templates die zijn voorgeschreven door de data-governancecommissie.
De databron configureert het geselecteerde gereedschap zodat er een werkbare omgeving ontstaat.
Indien nieuwe data gegenereerd gaat worden op bestaande data (bijvoorbeeld het annoteren van beelden) of een aanvulling is op bestaande data (bijvoorbeeld het uitzetten van een survey op basis van eerder gedaan bloedonderzoek) is:
1. de bestaande (zorg)data uit een zorgsysteem gehaald
2. de bestaande onderzoeksdataset aangevraagd via het proces data aanvragen
Indien bestaande data wordt gebruikt dan verzamelt en cureert de databron de bestaande data om die geschikt te maken voor verrijking ('te verrijken onderzoeksdataset').
De databron gebruikt het verrijkingsgereedschap om de dataverrijking te configureren.
De databron begint met het genereren van nieuwe datapunten, door middel van metingen, analyses, vragenlijsten en observaties. (Deze gegevens leiden in combinatie met optionele input, bijvoorbeeld zorgdataset of aangevraagd onderzoeksdataset, tot een verrijkingsdataset).
Wanneer de verrijkingsdataset gegenereerd is dan ontvangt de datagebruiker de gegenereerde data om te cureren en om te zetten naar een nieuwe onderzoeksdataset (gegenereerde onderzoeksdataset).
De datagebruiker maakt de gegenereerde onderzoeksdataset beschikbaar binnen het Health-RI ecosysteem door middel van het proces data beschikbaar maken bij de gewenste datahouder.

Postconditie

Er is een nieuwe (gegenereerde) onderzoeksdataset die beschikbaar gemaakt kan worden voor meervoudig gebruik.
De gebruiksvoorwaarden waarop de data vastgelegd mag worden t.b.v. meervoudig gebruik zijn bekend

Procesdiagram ‘Onderzoeksdata genereren’

In deze verhaallijn wordt gebruik gemaakt van de volgende bedrijfsobjecten:

Onderzoeksvoorstel: Een onderzoeksvoorstel is een gestructureerd document dat de basis vormt voor het plannen en uitvoeren van een onderzoek.
Data Capture Tooling: Tooling ten behoeve van het genereren van onderzoeksdata inclusief vastlegging van zeggenschap. Typische voorbeelden zijn EDC (Castor, Redcap, LibleClinica, XNAT, Omero). Een EPD, bijvoorbeeld vragenlijstenmodule, kan hier ook deel van uitmaken.
Gebruiksvoorwaarden: Gebruiksvoorwaarden zijn de regels en bepalingen die de relatie tussen een gebruiker en aanbieder van een product regelen. Ze beschrijven de rechten, plichten en verantwoordelijkheden van zowel de gebruiker als de aanbieder met betrekking tot het gebruik van het product.
Datamanagementplan: Een datamanagementplan (DMP) is een formeel document dat men aan het begin van een onderzoeksproject ontwikkelt en waarin alle aspecten van het beheer van de data worden beschreven, zowel tijdens als na het project.
Codetabel: Een codetabel is een verzameling van codes die worden gebruikt om bepaalde informatie te representeren, vaak in een gestructureerde vorm.
Standaard: Een standaard is een vastgestelde norm of specificatie die wordt gebruikt als referentiepunt voor het evalueren of produceren van iets.
Metadata dictionary: Een metadata dictionary is een gestructureerde verzameling van metadata-elementen en hun definities die wordt gebruikt om metadata binnen een specifiek domein of context te beheren en te beschrijven.
Inclusie en exclusiecriteria: inclusie en exclusiecriteria worden gebruikt om uit een patiënten dossier of populatiedatabank een data-extractie te doen waarvan de deelnemerslijst als basis (inclusielijst) dient voor het genereren van onderzoeksdata.
Inclusielijst: lijst van burgers/patiënten/deelnemers die voldoen aan (klinische) inclusie en exclusiecriteria.
Zeggenschap van de burger: de burger (deelnemer aan onderzoek) kan aangeven akkoord te zijn met of geeft geen bezwaar aan tegen het verzamelen en gebruiken van data voor wetenschappelijk onderzoek
Zorgdata: al bestaande patiënten-data in klinische zorgsystemen, zoals EPD, klinisch-PACS.
Zorgdataset: expliciet samenstelde/geselecteerde set van gegevens geëxtraheerd uit zorgsystemen, op basis van de inclusielijst. (Voor prospectieve scenario’s (impliciete selectie) is dat een dynamische/groeiende set, maar tbv de verhaallijn wordt uitgegaan van retrospectief scenario.)
Zorgsysteem: klinisch systeem gebruikt voor het verlenen van zorg aan patiënten.
Verrijkingsconfiguratie:
- Intekenprotocol
- Vragenlijst
- Analyseprotocol
- Follow-up
- AI-model
Verrijkingsdataset: de data die het resultaat is van de verrijking (op basis van een verrijkingsconfiguratie). Deze data is -indien van toepassing- gecombineerd met de data waarop de verrijking is uitgevoerd (bijvoorbeeld een zorgdataset of aangevraagde onderzoeksdataset)
Onderzoeksdataset: de onderzoeksdataset kent de volgende varianten
- aangevraagd (optioneel): onderzoeksdataset die is aangevraagd en binnen dit proces als bron wordt gebruikt om te verrijken
- te verrijken: onderzoeksdataset die binnen dit proces wordt verrijkt
- gegenereerd : resultante set van data (als in gereed voor uitgifte voor deze verhaallijn), expliciet samengesteld voor het onderzoeksproject