Health-RI wiki v4.0 -> consultatie (open tot 03-12-2024)


Img2catalog: automatisch beeldcollecties aanmelden

datum: 21-10-2024 Status: TER REVIEW

Het (handmatig) aanmelden van datasets t.b.v. een catalogus is een tijdrovend proces. Om het aanmelden van beelddatasets te versimpelen, heeft Health-RI de aanmeldtool img2catalog ontwikkeld. Deze tool stuurt periodiek metadatagegevens automatisch door en voorkomt daardoor handmatige invoer. Handmatige invoer is foutgevoeliger, arbeidsintensiever, en minder toekomstbestendig.

Context

Het Health-RI ecosysteem gebruikt FAIR Data Points (FDP) om de metadata van datasets in de catalogus te krijgen. De nationale gezondheidsdata catalogus is gekoppeld aan FAIR data points en maakt de beschrijvende gegevens van datacollecties vindbaar.

Elk knooppunt kan zelf besluiten of zij hun eigen FDP(s) en/of catalogus willen gebruiken, of dat ze rechtstreeks het landelijke (door Health-RI beheerde) FDP gebruiken.
In het geval van een eigen FDP kan deze aangemeld worden bij de Nationale Gezondheidsdata catalogus alsook bij andere (e.g. regionale of Europese) catalogi. Er zijn meer configuraties denkbaar (zie bijvoorbeeld Figuur 1).

image-20240429-145658.png
Figuur 1: Voorbeelden van hoe het proces van het aanmelden van beeldcollecties ingericht kan worden.

De aanmeldtool “img2catalog” kan zowel rechtstreeks bij een Health-RI FAIR Data Point (FDP) beeldcollecties aanmelden (Knooppunt A), alsmede bij een lokaal FDP die vervolgens gekoppeld kan worden aan de nationale gezondheidsdata catalogus (Knooppunt B).

Features

Img2Catalog is een command-line tool en ondersteunt de volgende features:

  • het genereren van metadata van een beelddataset in XNAT of Grandchallenge

  • het toevoegen c.q. bijwerken van metadata op een FAIR Data Point

Mapping

 De huidige versie van img2catalog mapt de Health-RI plateau 1 verplichte DCAT-AP velden. Deze mapping wordt als volgt gemaakt voor XNAT als beeldopslagplatform:

dcat:Catalog:

  • title: komt uit configuratiebestand

  • description: komt uit configuratiebestand

  • publisher: komt uit configuratiebestand

  • Dataset: IRIs van Datasets uit de XNAT

dcat:Dataset:

  • title: Title van XNAT project

  • description: Description van XNAT project

  • identifier: XNAT project id

  • keyword: XNAT keywords, waar elk keyword gescheiden door een spatie is

  • contactPoint: komt uit configuratiebestand, voor nu één vast contactpunt voor een gehele XNAT

  • creator: Gegevens van Principal Investigator uit XNAT

  • publisher: komt uit configuratiebestand

  • license: komt uit configuratiebestand

  • issued: tbd

  • modified: tbd

Img2Catalog werkt ook op Grand Challenge als beeldopslagplatform en wordt in een volgende versie geschikt gemaakt voor aansluiting op een datawarehouse.

Als in de toekomst de set verplichte DCAT-AP velden wordt aangepast dan worden die ook opgenomen in een volgende versie van Img2catalog.

Zie ook

Voor details betreffende installatie en gebruik, zie GitHub - Health-RI/img2catalog: Repository for a tool to help make XNAT into a FAIR Data Point