Verhaallijn: Data zoeken in metadata

Dit artikel beschrijft de verhaallijn data zoeken in metadata.

Een datagebruiker kan via een onderzoekersportaal op zoek gaan naar data die past bij de onderzoeksvraag. De zoekopdracht kan door middel van het gebruik van filters aangescherpt worden, en er kunnen vragen gesteld worden aan de datahouder middels een directe lijn. In het geval van publieke data is een dataset direct beschikbaar voor onderzoek. In het geval van niet-publieke data, kan de datagebruiker een vervolgproces starten: data aanvragen.

Opmerkingen

  • De keuze voor het gebruik van wybertjes (of junctions in ArchiMate) moet later nog worden aangescherpt. Misschien is de informatielaag niet geschikt voor het tonen van deze “keuzepunten”, maar kunnen we dit in de applicatielaag tonen.

  • Er dient bewaking plaats te vinden op mogelijkheid van zoekopdrachten. In het verleden is al aangetoond dat een zeer uitgebreide zoekmogelijkheid op (combinaties van) data al kan leiden tot resultaten die op zichzelf al tot diepgaand inzicht in de verzamelde data leiden, waarbij zelfs publicatie van nieuwe inzichten op basis van toegang tot slechts de catalogus/portal mogelijk wordt.

  • Feasibility studies zijn op het moment van schrijven (nog) niet binnen deze verhaallijn opgenomen.

Preconditie

  • Er is een catalogus die regelmatig en/of getriggerd d.m.v. een zoekopdracht de laatste stand van zaken bij de aangesloten data-aanbieders (FAIR data point registers en/of FAIR data points) ophaalt.

  • De datagebruiker heeft een motivatie om op zoek te gaan naar data

    • Er wordt een onderzoeksvoorstel gemaakt waarvoor uitgezocht moet worden welke data gebruikt kan worden

    • Er is al een onderzoeksvoorstel waarvoor bruikbare data gezocht wordt.

Procesmodel

  1. De datagebruiker vindt bij de catalogus een overzichtslijst van metadata van datasets.
    Binnen deze lijst zijn meerdere datacategorieën beschikbaar (denk aan verschillende datatypes, instituten, en onderzoeksgebieden).

  2. Een datagebruiker kan filters toepassen in de catalogus om de zoekopdracht zo relevant mogelijke resultaten te laten opleveren.

  3. Bij het nader inspecteren van een specifieke dataset (uit een lijst van resultaten) zijn er drie mogelijkheden: de dataset is óf publiek toegankelijk, of vereist identificatie en authenticatie om de (impliciete) autorisatie van de datagebruiker te controleren, of vereist een (expliciete autorisatie middels) goedgekeurde aanvraag van de datagebruiker.

    1. Indien de dataset publiek toegankelijk is, kan de dataset direct worden gedownload.

    2. Indien (een deel van) de metadata van de dataset niet publiek toegankelijk is, maar beschikbaar kan worden gesteld als de datagebruiker tot de impliciet geautoriseerde gebruikers dan wel gebruikersgroepen behoort, dient de datagebruiker zich te authentiseren en is daarna dat deel van de metadata van de dataset beschikbaar.

    3. Indien (een deel van) de metadata van de dataset niet publiek toegankelijk is en alleen beschikbaar kan worden gemaakt aan datagebruiker na een goedgekeurde aanvraag.

  4. Bij succesvolle identificatie en authenticatie en juiste autorisatie, kan de datagebruiker meer metadata van de dataset inzien.

  5. De datagebruiker kan detailvragen direct aan de data-aanbieder van een dataset stellen, welke deze vragen kan beantwoorden.

  6. De datagebruiker kan ervoor kiezen om een aanvraag voor toegang tot de dataset te starten (door middel van het proces data aanvragen).

Postconditie

  • De datagebruiker heeft een aantal datasets gevonden die

    • of publiek beschikbaar zijn en direct opgehaald kunnen worden

    • of waarvoor toegang aangevraagd moet worden bij de datahouder

Procesdiagram “data zoeken in metadata”