Verhaallijn: Gefedereerd analyseren

datum: 23-08-2024 Status: VASTGESTELD

Dit artikel beschrijft de verhaallijn gefedereerd analyseren.

In deze verhaallijn wordt beschreven hoe een gefedereerde analyse, die is opgesteld door de datagebruiker, in de Verhaallijn: Data aanvragen wordt uitgevoerd door een Coördinator Gefedereerde analyse, participerende data-aanbieders en data processors. In de Verhaallijn: Data-uitgifte na aanvraag is de aangevraagde data beschikbaar gemaakt door de data-aanbieders voor gefedereerde analyse.

Opmerkingen

  • Deze verhaallijn beschrijft een generiek proces voor gefedereerde analyse. Hierbinnen passen ook eerder beschreven concepten voor gefedereerde analyse, zoals de Personal Health Train (PHT).

  • In deze verhaallijn wordt gefedereerde analyse met een centrale aggregator beschreven op horizontaal gepartitioneerde data.

  • In het geval van verticaal gepartitioneerde data zijn bredere afspraken nodig. Deze dienen nog verder uitgewerkt te worden en de bijbehorende verhaallijn (of aanpassing/uitbreiding op deze) zal in een volgende versie van het architectuurontwerp worden beschreven.

  • In deze verhaallijn wordt er een gefedereerde analyse met één verwerker getoond; in de praktijk kunnen er N stations aangedaan worden. De beschrijving vermeldt welke acties er dan door alle deelnemende stations worden uitgevoerd. In het diagram wordt de onderste rij uitgevoerd per deelnemende partij aan de verwerking.

  • In deze verhaallijn worden de functies ‘Analyse Initiëren' en ‘Resultaten verwerken’ uitgevoerd door dezelfde Coördinator Gefedereerde Analyse. Er zijn scenario’s waarin deze functies verdeeld worden over twee Coördinatoren Gefedereerde Analyse.

Preconditie

  • De datagebruiker heeft een data-aanvraag ingediend (inclusief de uit te voeren federatieve analyse), en deze is goedgekeurd door de respectievelijke toetsingscommissies.

  • De databronnen zijn FAIR ontsloten op basis van een gedeelde ontologie die bekend is bij de deelnemende stations.

  • De contracten zijn getekend.

  • De data-aanbieder is aangesloten op een netwerk dat gefedereerde analyse ondersteunt.

  • De aangevraagde data is beschikbaar gemaakt op de gefedereerde datastations d.m.v. de Verhaallijn: Data-uitgifte na aanvraag

Procesmodel

  1. De datagebruiker geeft aan de Coördinator Gefedereerde Analyse het signaal om de gefedereerde analyse te starten en geeft aan waar de Coördinator Gefedereerde Analyse de in het aanvraagproces goedgekeurde analyse kan ophalen dan wel stuurt deze op.

  2. De Coördinator Gefedereerde Analyse haalt de in de aanvraag goedgekeurde analyse op en verstuurt deze naar alle betrokken data processors.

  3. De betrokken data processor voert de door de datagebruiker vastgestelde federatieve analyse uit op de beschikbaar gestelde data.

  4. De Coördinator Gefedereerde Analyse informeert bij de betrokken data processor of de analyse is afgerond. Als dat zo is dan haalt de Coördinator Gefedereerde Analyse het gefedereerde analyseresultaat op.

  5. De Coördinator Gefedereerde Analyse verwerkt de toegestuurde resultaten conform afgesproken formaat en inhoud.

  6. De Coördinator Gefedereerde Analyse stuurt afhankelijk van gemaakte afspraken het uiteindelijke (deel)resultaat van de federatieve analyse naar de datagebruiker en geeft aan of de aangevraagde federatieve analyse volledig of deels is afgerond.

  7. De datagebruiker ontvangt de (deel)resultaten van de federatieve analyse en verwerkt die eventueel verder. Indien een deelresultaat door de Coördinator Gefedereerde Analyse is toegestuurd bepaalt de datagebruiker of de federatieve analyse al dan niet gestopt kan worden of dat de federatieve analyse pas stopt na ontvangst van complete resultaat.

  8. De datagebruiker genereert de onderzoeksresultaten door middel van het proces beschreven in de Verhaallijn: Onderzoeksdata genereren.

  9. De datagebruiker maakt de nieuw gegenereerde onderzoeksresultaten beschikbaar binnen het Health-RI ecosysteem door middel van het proces beschreven in de Verhaallijn: Data beschikbaar maken bij de gewenste datahouder.

  10. De datagebruiker heeft het onderzoek afgerond en ruimt de gebruikte omgeving volgens vastgestelde dan wel geldende afspraken op.

    • De datasets en algoritme/pipeline bij data processors

    • De goedgekeurde aanvraag en algoritme/pipeline bij Coördinator Gefedereerde analyse

Postconditie

  • Het onderzoek is uitgevoerd en de resultaten zijn veiliggesteld.

  • Het data management plan is bijgewerkt.

  • Het onderzoeksproject is beëindigd.

  • De onderzoeksresultaten zijn gereed om beschikbaar gemaakt te worden.

  • de (deel)resultaten bij de coördinator gefedereerde analyse en de deelresultaten en data bij de data processoren zijn opgeruimd.

  • Het onderzoek is zodanig gedocumenteerd dat het herhaalbaar is.

 

image-20240513-092528.png
Procesdiagram “gefedereerd analyseren'

 

 

Â