Health-RI wiki v4.0 -> consultatie (open tot 03-12-2024)


Verhaallijn: Gefedereerd analyseren

Dit artikel beschrijft de verhaallijn gefedereerd analyseren.

In deze verhaallijn wordt beschreven hoe een gefedereerde analyse, die is opgesteld door de datagebruiker in de Verhaallijn: Data aanvragen wordt uitgevoerd door een Coördinator Gefedereerde analyse, participerende data-aanbieders en dataverwerkers. In de Verhaallijn: Toegang verlenen tot data is de aangevraagde data beschikbaar gemaakt door de data-aanbieders voor gefedereerde analyse.

Opmerkingen

  • Deze verhaallijn beschrijft een generiek proces voor gefedereerde analyse. Hierbinnen passen ook eerder beschreven concepten voor gefedereerde analyse, zoals de Personal Health Train (PHT).

  • In deze verhaallijn wordt gefedereerde analyse met een centrale aggregator beschreven op horizontaal gepartitioneerde data.

  • In het geval van verticaal gepartitioneerde data zijn bredere afspraken nodig. Deze dienen nog verder uitgewerkt te worden en de bijbehorende verhaallijn (of aanpassing/uitbreiding op deze) zal in een volgende versie van het architectuurontwerp worden beschreven.

  • In deze verhaallijn wordt er een gefedereerde analyse met één verwerker getoond; in de praktijk kunnen er N stations aangedaan worden. De beschrijving vermeldt welke acties er dan door alle deelnemende stations worden uitgevoerd. In het diagram wordt de onderste rij uitgevoerd per deelnemende partij aan de verwerking.

  • In deze verhaallijn worden de functies ‘Analyse Initiëren' en ‘Resultaten verwerken’ uitgevoerd door dezelfde Coördinator Gefedereerde Analyse. Er zijn scenario’s waarin deze functies verdeeld worden over twee Coördinatoren Gefedereerde Analyse.

Preconditie

  • De datagebruiker heeft een data-aanvraag ingediend (inclusief de uit te voeren federatieve analyse), en deze is goedgekeurd door de respectievelijke toetsingscommissies.

  • De databronnen zijn FAIR ontsloten op basis van een gedeelde ontologie die bekend is bij de deelnemende stations.

  • De contracten zijn getekend.

  • De data-aanbieder is aangesloten op een netwerk dat gefedereerde analyse ondersteunt.

  • De aangevraagde data is beschikbaar gemaakt op de gefedereerde datastations d.m.v. de Verhaallijn: Toegang verlenen tot data

Procesmodel

  1. De datagebruiker geeft aan de Coördinator Gefedereerde Analyse het signaal om de gefedereerde analyse te starten en geeft aan waar de Coördinator Gefedereerde Analyse de in het aanvraagproces goedgekeurde analyse kan ophalen dan wel stuurt deze op.

  2. De Coördinator Gefedereerde Analyse haalt de in de aanvraag goedgekeurde analyse op en verstuurt deze naar alle betrokken dataverwerkers.

  3. De betrokken dataverwerkers voert de door de datagebruiker vastgestelde federatieve analyse uit op de beschikbaar gestelde data.

  4. De Coördinator Gefedereerde Analyse informeert bij de betrokken dataverwerkers of de analyse is afgerond. Als dat zo is dan haalt de Coördinator Gefedereerde Analyse het gefedereerde analyseresultaat op.

  5. De Coördinator Gefedereerde Analyse verwerkt de toegestuurde resultaten conform afgesproken formaat en inhoud.

  6. De Coördinator Gefedereerde Analyse stuurt afhankelijk van gemaakte afspraken het uiteindelijke (deel)resultaat van de federatieve analyse naar de datagebruiker en geeft aan of de aangevraagde federatieve analyse volledig of deels is afgerond.

  7. De datagebruiker ontvangt de (deel)resultaten van de federatieve analyse en verwerkt die eventueel verder. Indien een deelresultaat door de Coördinator Gefedereerde Analyse is toegestuurd bepaalt de datagebruiker of de federatieve analyse al dan niet gestopt kan worden of dat de federatieve analyse pas stopt na ontvangst van complete resultaat.

  8. De datagebruiker genereert de onderzoeksresultaten door middel van het proces beschreven in de Verhaallijn: Onderzoeksdata genereren.

  9. De datagebruiker maakt de nieuw gegenereerde onderzoeksresultaten beschikbaar binnen het Health-RI ecosysteem door middel van het proces beschreven in de Verhaallijn: Data beschikbaar maken bij de gewenste datahouder.

  10. De datagebruiker heeft het onderzoek afgerond en ruimt de gebruikte omgeving volgens vastgestelde dan wel geldende afspraken op.

    • De datasets en algoritme/pipeline bij dataverwerkers

    • De goedgekeurde aanvraag en algoritme/pipeline bij Coördinator Gefedereerde analyse

Postconditie

  • Het onderzoek is uitgevoerd en de resultaten zijn veiliggesteld.

  • Het data management plan is bijgewerkt.

  • Het onderzoeksproject is beëindigd.

  • De onderzoeksresultaten zijn gereed om beschikbaar gemaakt te worden.

  • de (deel)resultaten bij de coördinator gefedereerde analyse en de deelresultaten en data bij de data verwerkers zijn opgeruimd.

  • Het onderzoek is zodanig gedocumenteerd dat het herhaalbaar is.

 

image-20241113-091046.png
Procesdiagram “gefedereerd analyseren'

 

 

 

 

 

Â