Health-RI wiki v4.0 -> consultatie (open tot 03-12-2024)
Verhaallijn: Data zoeken in metadata
Dit artikel beschrijft de verhaallijn data zoeken in metadata.
Een datagebruiker kan via een onderzoekersportaal op zoek gaan naar data die past bij de onderzoeksvraag. De zoekopdracht kan door middel van het gebruik van filters aangescherpt worden, en er kunnen vragen gesteld worden aan de datahouder middels een directe lijn. In het geval van publieke data is een dataset direct beschikbaar voor onderzoek. In het geval van niet-publieke data, kan de datagebruiker een vervolgproces starten: data aanvragen.
Deze verhaallijn is van toepassing bij
het zoeken naar databronnen om te registreren in een onderzoeksvoorstel en/of een datamanagement plan
als voorbereidende stap op het vervolgproces: Verhaallijn: Data aanvragen
Opmerkingen
De keuze voor het gebruik van wybertjes (of junctions in ArchiMate) moet later nog worden aangescherpt. Misschien is de informatielaag niet geschikt voor het tonen van deze “keuzepunten”, maar kunnen we dit in de applicatielaag tonen.
Er dient bewaking plaats te vinden op mogelijkheid van zoekopdrachten. In het verleden is al aangetoond dat een zeer uitgebreide zoekmogelijkheid op (combinaties van) data al kan leiden tot resultaten die op zichzelf al tot diepgaand inzicht in de verzamelde data leiden, waarbij zelfs publicatie van nieuwe inzichten op basis van toegang tot slechts de catalogus/portal mogelijk wordt.
Feasibility studies zijn op het moment van schrijven (nog) niet binnen deze verhaallijn opgenomen.
Preconditie
Er is een catalogus die regelmatig en/of getriggerd d.m.v. een zoekopdracht de laatste stand van zaken bij de aangesloten data-aanbieders (FAIR data point registers en/of FAIR data points) ophaalt.
De datagebruiker heeft een motivatie om op zoek te gaan naar data
Er wordt een onderzoeksvoorstel gemaakt waarvoor uitgezocht moet worden welke data gebruikt kan worden
Er is al een goedgekeurd onderzoeksvoorstel waarvoor de data moet worden aangevraagd.
Procesmodel
De datagebruiker vindt bij de catalogus een overzichtslijst van metadata van datasets.
Binnen deze lijst zijn meerdere datacategorieën beschikbaar (denk aan verschillende datatypes, instituten, en onderzoeksgebieden).Een datagebruiker kan filters toepassen in de catalogus om de zoekopdracht zo relevant mogelijke resultaten te laten opleveren.
Bij het nader inspecteren van een specifieke dataset (uit een lijst van resultaten) zijn er drie mogelijkheden: de dataset is óf publiek toegankelijk, of vereist identificatie en authenticatie om de (impliciete) autorisatie van de datagebruiker te controleren, of vereist een (expliciete autorisatie middels) goedgekeurde aanvraag van de datagebruiker.
Indien de dataset publiek toegankelijk is, kan de dataset direct worden gedownload.
Indien (een deel van) de metadata van de dataset niet publiek toegankelijk is, maar beschikbaar kan worden gesteld als de datagebruiker tot de impliciet geautoriseerde gebruikers dan wel gebruikersgroepen behoort, dient de datagebruiker zich te authentiseren en is daarna dat deel van de metadata van de dataset beschikbaar.
Indien (een deel van) de metadata van de dataset niet publiek toegankelijk is en alleen beschikbaar kan worden gemaakt aan datagebruiker na een goedgekeurde aanvraag.
Bij succesvolle identificatie en authenticatie en juiste autorisatie, kan de datagebruiker meer metadata van de dataset inzien.
De datagebruiker kan detailvragen direct aan de data-aanbieder van een dataset stellen, die deze vragen kan beantwoorden.
De datagebruiker kan
de gevonden datasets opnemen in een onderzoeksvoorstel
ervoor kiezen om een aanvraag voor toegang tot de dataset te starten (door middel van het proces data aanvragen)
Postconditie
De datagebruiker heeft een aantal datasets gevonden die
of publiek beschikbaar zijn en direct opgehaald kunnen worden
of waarvoor toegang aangevraagd moet worden bij de datahouder
In deze verhaallijn wordt gebruik gemaakt van de volgende bedrijfsobjecten:
Samengevoegde metadata: een verzameling metadata van datasets die zijn opgenomen in een catalogus
Zoekfilter: een of meerdere zoekcriteria die zijn gebruikt om een of meerdere datasets te vinden
Vraag over dataset: een verdiepende vraag over een of meerdere specifieke datasets
Geselecteerde dataset: een dataset die geschikt wordt geacht om als bron te dienen voor een onderzoek
Onderzoeksvoorstel: Een onderzoeksvoorstel is een gestructureerd document dat de basis vormt voor het plannen en uitvoeren van een onderzoek.