Health-RI wiki v4.0 -> consultatie (open tot 03-12-2024)


Verhaallijn: Data zoeken in metadata

datum: 12-11-2024 Status: TER REVIEW

Dit artikel beschrijft de verhaallijn data zoeken in metadata.

Een datagebruiker kan via een onderzoekersportaal op zoek gaan naar data die past bij de onderzoeksvraag. De zoekopdracht kan door middel van het gebruik van filters aangescherpt worden, en er kunnen vragen gesteld worden aan de datahouder middels een directe lijn. In het geval van publieke data is een dataset direct beschikbaar voor onderzoek. In het geval van niet-publieke data, kan de datagebruiker een vervolgproces starten: data aanvragen.

Deze verhaallijn is van toepassing bij

Opmerkingen

  • De keuze voor het gebruik van wybertjes (of junctions in ArchiMate) moet later nog worden aangescherpt. Misschien is de informatielaag niet geschikt voor het tonen van deze “keuzepunten”, maar kunnen we dit in de applicatielaag tonen.

  • Er dient bewaking plaats te vinden op mogelijkheid van zoekopdrachten. In het verleden is al aangetoond dat een zeer uitgebreide zoekmogelijkheid op (combinaties van) data al kan leiden tot resultaten die op zichzelf al tot diepgaand inzicht in de verzamelde data leiden, waarbij zelfs publicatie van nieuwe inzichten op basis van toegang tot slechts de catalogus/portal mogelijk wordt.

  • Feasibility studies zijn op het moment van schrijven (nog) niet binnen deze verhaallijn opgenomen.

Preconditie

  • Er is een catalogus die regelmatig en/of getriggerd d.m.v. een zoekopdracht de laatste stand van zaken bij de aangesloten data-aanbieders (FAIR data point registers en/of FAIR data points) ophaalt.

  • De datagebruiker heeft een motivatie om op zoek te gaan naar data

    • Er wordt een onderzoeksvoorstel gemaakt waarvoor uitgezocht moet worden welke data gebruikt kan worden

    • Er is al een goedgekeurd onderzoeksvoorstel waarvoor de data moet worden aangevraagd.

Procesmodel

  1. De datagebruiker vindt bij de catalogus een overzichtslijst van metadata van datasets.
    Binnen deze lijst zijn meerdere datacategorieën beschikbaar (denk aan verschillende datatypes, instituten, en onderzoeksgebieden).

  2. Een datagebruiker kan filters toepassen in de catalogus om de zoekopdracht zo relevant mogelijke resultaten te laten opleveren.

  3. Bij het nader inspecteren van een specifieke dataset (uit een lijst van resultaten) zijn er drie mogelijkheden: de dataset is óf publiek toegankelijk, of vereist identificatie en authenticatie om de (impliciete) autorisatie van de datagebruiker te controleren, of vereist een (expliciete autorisatie middels) goedgekeurde aanvraag van de datagebruiker.

    1. Indien de dataset publiek toegankelijk is, kan de dataset direct worden gedownload.

    2. Indien (een deel van) de metadata van de dataset niet publiek toegankelijk is, maar beschikbaar kan worden gesteld als de datagebruiker tot de impliciet geautoriseerde gebruikers dan wel gebruikersgroepen behoort, dient de datagebruiker zich te authentiseren en is daarna dat deel van de metadata van de dataset beschikbaar.

    3. Indien (een deel van) de metadata van de dataset niet publiek toegankelijk is en alleen beschikbaar kan worden gemaakt aan datagebruiker na een goedgekeurde aanvraag.

  4. Bij succesvolle identificatie en authenticatie en juiste autorisatie, kan de datagebruiker meer metadata van de dataset inzien.

  5. De datagebruiker kan detailvragen direct aan de data-aanbieder van een dataset stellen, die deze vragen kan beantwoorden.

  6. De datagebruiker kan

    1. de gevonden datasets opnemen in een onderzoeksvoorstel

    2. ervoor kiezen om een aanvraag voor toegang tot de dataset te starten (door middel van het proces data aanvragen)

Postconditie

  • De datagebruiker heeft een aantal datasets gevonden die

    • of publiek beschikbaar zijn en direct opgehaald kunnen worden

    • of waarvoor toegang aangevraagd moet worden bij de datahouder

 

image-20241107-144617.png
Procesdiagram “data zoeken in metadata”

In deze verhaallijn wordt gebruik gemaakt van de volgende bedrijfsobjecten:

  • Samengevoegde metadata: een verzameling metadata van datasets die zijn opgenomen in een catalogus

  • Zoekfilter: een of meerdere zoekcriteria die zijn gebruikt om een of meerdere datasets te vinden

  • Vraag over dataset: een verdiepende vraag over een of meerdere specifieke datasets

  • Geselecteerde dataset: een dataset die geschikt wordt geacht om als bron te dienen voor een onderzoek

  • Onderzoeksvoorstel: Een onderzoeksvoorstel is een gestructureerd document dat de basis vormt voor het plannen en uitvoeren van een onderzoek.