Health-RI wiki v4.0 -> consultatie (open tot 03-12-2024)
Metadata rondom gebruiksvoorwaarden, authenticatie / autorisatie en ELSI aspecten
Dit artikel beschrijft een voorstel voor ‘ELSI metadata’ waarmee bedoeld wordt: metadata over de voorwaarden en restricties die gelden bij hergebruik van data, ELSI elementen die belangrijk zijn in een data-aanvraag en ELSI elementen die belangrijk zijn bij goedkeuring van een aanvraag met een focus op authenticatie en autorisatie.
Metadata voor autorisatie en ELSI-aspecten zijn van belang in verschillende delen van de Health-RI infrastructuur. Hierbij hebben we gekeken naar de volgende user stories:
Datasets vinden
Datasets aanvragen
Datasets analyseren
Datasets publiceren in de catalogus
Het is belangrijk om hierbij wettelijke verplichtingen zowel op nationaal niveau als op Europees niveau mee te nemen. Er is voornamelijk gekeken naar de volgende wet-, en regelgeving: AVG, WMO, EHDS en de Gedragscode gezondheidsonderzoek. Daarnaast is gekeken naar de NFU template MTA/DTA en consentformulieren van verschillende ziekenhuizen.
We stellen de volgende metadata-elementen voor en geven hierbij waar mogelijk alvast een suggestie voor de geschikte ontologie systemen.
Catalogus
Het is van belang om in de catalogus aan te geven wat de voorwaarden voor gebruik zijn zodat een gebruiker in een vroeg stadium kan beoordelen of een aanvraag van deze dataset kansrijk is. Daarnaast is het voor het proces van belang om informatie te hebben over wie kan beslissen over een aanvraag.
Voorwaarden voor gebruik zijn gebaseerd op wet en regelgeving (UAVG, Data Governance Act, Wet hergebruik overheidsinformatie, databankenwet, AVG, EHDS, Data Act, etc.) en voorwaarden die gesteld worden op basis van controle van intellectueel eigendom (bijv. copyright en databankrechten) en de rechten van de burger (consent (opt-in) en/of bezwaar (opt-out)). Veel van deze elementen (vetgedrukt) worden in HealthDCAT-AP al vastgelegd en hiervoor hebben we maar beperkte ruimte om een eigen invulling te geven.
Metadata-element | Uitleg | Aanbevolen codering | Voorbeelden/ opmerkingen |
dct:Publisher Publisher | Wie is de aanbieder van de data? | foaf:Agent | Het ziekenhuis, dit zal meestal ook de data controller zijn. |
dpv:hasLegalBasis Grondslag | De categorie grondslag op basis waarvan de data verzameld is (zoals in de AVG art 6.1 a t/m f). | dpv:LegalBasis
| Bijvoorbeeld consent (bijv. bij wetenschappelijk onderzoek) of wettelijke verplichting (bijv. bij de kwaliteitsregisters). |
dcatap:applicableLegislation dpv:hasApplicableLaw Wettelijke basis | Als de grondslag (zie boven) een wettelijke verplichting is kan hiermee aangegeven worden op basis van welke wetgeving. | Persistent URL voor de wet | Alternatief is dpv:hasApplicableLaw maar dcatap:applicableLegislation is onderdeel van HealthDCAT-AP. |
dpv:hasJurisdiction Jurisdictie | Jurisdictie waaronder de dataset valt. | dpv:Location | Binnen Nederland zal dit waarschijnlijk NL en EU zijn. |
dpv:hasPersonalData Bevat persoonsgegevens | Data categorieën (die eventueel gelinkt kunnen worden naar een persoon) die deze dataset bevat. | dpv:PersonalData | Location, SexualOrientation, MedicalHistory |
dct:accessRights Access Rights | Indicatie of een dataset open is of niet. Indien een dataset niet openbaar toegankelijk is, kunnen de onderstaande velden gebruikt worden om de voorwaarden of restricties verder te specificeren. | dct:RightsStatement
| Restricted of sensitive (in geval van identificerende data). In dat geval onderstaande velden gebruiken voor specificering van voorwaarden/restricties. Public (in geval van anonieme data). In HealthDCAT-AP beperkt tot de opties uit de EU-Voc access rights vocabulary.
|
Voorwaarden voor gebruik | De belangrijkste voorwaarden gecodeerd in een machine leesbaar formaat. Bruikbaar om te filteren of om op basis hiervan aanvullende vragen te stellen in tijdens de aanvraag. Bijvoorbeeld of er kosten gerekend worden. | DUO, DUC/CCE of ODRL
| DUO of DUC/CCE kunnen ook als ‘syntactic sugar’ dienen en onder water naar ODRL geconverteerd worden, predicate moet nog gedefinieerd worden. |
Link naar voorwaarden document | Denk hierbij aan MTA, Consent formulieren. | Persistent URL | Predicate moet nog gedefinieerd worden. Eventueel foaf:Page gebruiken? |
Bevat intellectueel eigendom | Bevat de dataset intellectueel eigendom dat bescherming behoeft?
| Boolean
| Dit zal bijna altijd nee zijn, maar wordt in de EHDS gedefinieerd, omdat er maatregelen genomen mogen worden om intellectueel eigendom te beschermen. Dit kan later van belang zijn in het aanvraagproces. Predicate moet nog gedefinieerd worden. |
healthdcatap:hdab Health Data Access Body | Health Data Access Body die goedkeuring kan geven voor secundair gebruik onder de voorwaarden van de EHDS. | foaf:Agent
| Dit veld wordt pas geïmplementeerd zodra HDAB er is. Tot die tijd is data controller de contactpersoon omtrent toetsing. |
Koppelsleutels | Koppelsleutels die beschikbaar zijn om eventueel te linken met andere datasets. |
| Deze kunnen beschikbaar zijn naast de dataset en niet uitgeleverd worden. Bijv. directe of indirecte identifiers, zoals NAW-gegevens. Predicate en range voor object moeten nog gedefinieerd worden. |
Aanvraagprocedure
Voor de aanvraagprocedure hebben we geprobeerd om een logische workflow te definiëren waarin zaken gevraagd worden (hier niet gepubliceerd omdat dit ondertussen verouderd is). Op basis van die voorlopige workflow is gekeken naar mogelijke metadata elementen.
Metadata-element | Uitleg | Aanbevolen codering |
Doelbinding | Doel waarvoor de data aangevraagd wordt.
| DPV. Categorieën uit EHDS 34, AVG 5.1 en daarnaast vrije tekst voor doelen daarbuiten. Op basis van de doelbinding kan getoetst worden of EHDS mogelijk van toepassing is. |
Doel/onderzoeksvraag | Beschrijving van het doel/onderzoeksvraag waarvoor de data wordt gevraagd. | Tekst of een document |
Aanvrager | Gegevens van de persoon (zie metadata beschrijving hieronder). |
|
Aanvraag uit functie of als individu | Relevant om te weten wie tekenbevoegd is. | Boolean waarde |
Organisatie | Indien de aanvraag uit hoofde van de rol van de aanvrager binnen een organisatie is. | ROR identifier, foaf:Agent |
Functie | Functie van de persoon binnen de organisatie (zie metadata beschrijving hieronder). |
|
Persoonsgegevens contactpersoon voor controle bevoegdheid van de aanvrager | Gegevens van de persoon (zie metadata beschrijving hieronder). |
|
Hoofdonderzoeker (Principal Investigator) | Gegevens van de persoon (zie metadata beschrijving hieronder). |
|
dpv:hasImpactAssessment DPIA | Data Privacy Impact Analyse, alleen noodzakelijk indien de aangevraagde dataset persoonsgegevens bevat in de zin van de AVG bevat (gevraagd in EHDS). | dpv:PIA |
Data Management plan | Data management plan (gevraagd in EHDS). |
|
Gewenste formaat | Vanuit de EHDS gevraagd. |
|
Specificatie | Vanuit de EHDS gevraagd. Belangrijkste aantal personen / distributie. Variabelen. |
|
Financiële gegevens | Indien er kosten worden berekend (te specificeren in de catalogus onder use conditions) vragen. |
|
Authenticatie en autorisatie metadata
Het is van belang om eenduidig vast te stellen wie een aanvraag doet en toegang heeft tot data. Voor het vaststellen van de identiteit zijn verschillende mogelijkheden. Wat van toepassing is hangt samen met de mate van zekerheid die vereist is en is een afweging die gemaakt moet worden door Health-RI en de betrokken datahouders. In de onderstaande tabel staan een aantal metadata-velden gedefinieerd die bruikbaar zijn om hier controle over te houden. Deze lijst is nadrukkelijk geen datamodel. Bij het modelleren dient men er rekening mee te houden dat mensen verschillende rollen in verschillende aanvragen kunnen hebben en zich mogelijk op verschillende manieren authentiseren afhankelijk van de rol.
Authenticate metadata
Metadata-element | Uitleg | Aanbevolen codering |
Volledige naam | Volledige naam van de persoon in de gebruikelijk schrijfwijze. N.B. Namen zijn niet uniek en kunnen over de tijd veranderen. |
|
Identifier | Unique identifier van de persoon binnen het systeem. |
|
Rol | Rol van de persoon binnen het proces, bijvoorbeeld Aanvrager, PI, Data Manager, Privacy officer. EHDS vereist dat de mensen met toegang tot de data vermeld worden in de aanvraag en data permit. | DPV mogelijk uitbreidingen nodig |
E-mailadres | Contact e-mail adres van de persoon. Dit moet een persoonsgebonden adres zijn, geen groepsadres. | FOAF of vCard, DCAT gebruikt beide op verschillende plaatsen |
Telefoonnummer | Contact telefoonnummer, bij voorkeur een rechtstreeks nummer. |
|
Authenticatie methode | Manier waarop de persoon is ingelogd voor deze sessie (bijv. username/password, gefedereerde login). |
|
Tijdstip van inloggen | Het moment van inloggen. | ISO 8601 |
Methode van vaststellen van de identiteit | Methode waarmee de identiteit is vastgesteld, bijv. via online methodes zoals federated login, of offline methodes als controle van paspoort. | Hiervoor moet een codelijst vastgesteld worden. |
Autorisatie/data permit
Indien een persoon geautoriseerd is om de gevraagde data te gebruiken kan dit vastgelegd worden in een data permit (EHDS). De EHDS beschrijft in artikel 46.6 wat hierin vastgelegd moet worden. Het voorstel is om deze structuur mutatis mutandis altijd te gebruiken.
Metadata-element | Uitleg | Aanbevolen codering |
Categorieën
| Vanuit de EHDS is een lijst van categorieën gezondheidsdata vastgelegd. |
|
Specificatie | Specificatie van de data. Selectiecriteria, variabelen en aantal datapunten. Eventueel ook distributie. |
|
Formaat | Formaat waarin de data beschikbaar gesteld is. |
|
Gepseudonimiseerde data? | Betreft het identificerende data of gepseudonimiseerde of geanonimiseerde data? | Antoinette Vlieger stelde voor om uit te gaan van vier categorieën:
Dit gaat dan om de context waarin de data gebruikt wordt. Data kan in de context van een ziekenhuis identificerend zijn, maar in de context van onderzoek niet identificerend zijn omdat de koppelsleutel daar niet bekend is. |
Beschrijving van het doel | Beschrijving van het doel waarvoor de data is aangevraagd, kan overgenomen worden uit de aanvraag zelf. |
|
Geautoriseerde personen | EHDS vraagt een lijst van alle geautoriseerde personen die toegang hebben tot de secure processing environment, maar de PI is al een goed begin. |
|
Tijdsduur dat de data permit geldig is |
| ISO begin / end datum of tijdsduur vanaf akkoord |
Informatie over de in de Secure Processing Environment beschikbare tools en hun karakteristieken | EHDS vraagt om details van de omgeving, maar in eerste instantie lijkt het ons voldoende om aan te geven welke SPE gebruikt wordt. Eventueel verwijzen naar een beschrijving van de SPE elders. Alleen als er voor de gebruiker extra tools geïnstalleerd worden dit expliciet opnemen. |
|
Kosten |
|
|
Aanvullende voorwaarden | Afgesproken voorwaarden, bijvoorbeeld uit een MTA/DTA of DAA. |
|
Link naar MTA/DTA/DAA | Link naar de documenten. |
|
Datum van akkoord | Datum waarop de permit geaccordeerd is door alle partijen. |
|
Resources
Gedragscode Gezondheidsonderzoek: https://elsi.health-ri.nl/sites/elsi/files/2022-01/Gedragscode_Gezondheidsonderzoek_2022.pdf
NFU Template MTA/DTA https://elsi.health-ri.nl/sites/elsi/files/2020-07/20.30817%20OenO%20Template%20-%20Material%20and%20associated%20Data%20Transfer%20Agreement.pdf
Template Clinical Trial Agreement https://dcrfonline.nl/werkgroepen/clinical-trial-agreement/
DCAT-AP Health draft (template: GitHub · Build and ship software on a single, collaborative platform )
Codesystemen:
Data Use Ontology (DUO) https://doi.org/10.1016/j.xgen.2021.100028
Digital Use Conditions Getting Your DUCs in a Row - Standardising the Representation of Digital Use Conditions (pre-print)
Common Conditions of Use Elements https://zenodo.org/records/8200079 (pre-print)
ROR https://ror.org
DPV LEGAL-EU https://w3c.github.io/dpv/legal/eu/
“Enhancing Data Use Ontology (DUO) for health-data sharing by extending it with ODRL and DPV” https://doi.org/10.3233/SW-243583
DCAT-AP
EU-Vocabularies: EU Vocabularies - Home - EU Vocabularies - Publications Office of the EU
Wetgeving, o.a.
AVG & UAVG
EHDS
WMO
WGBO