Privacy beschermende technieken om gedeelde analyses te maken

Omslag, Privacy Preserving Vertically Partitioned Federated Learning: New Techniques and Considerations, Florian van Daalen
© CBS
Proefschrift over het maken van analyses op data verdeeld over meerdere instituten gebruikmakend van federated learning om de privacy te waarborgen.

Data wordt vaak verzameld door verschillende instituten. Het analyseren van deze data is moeilijk omdat deze data niet simpelweg mag worden gedeeld i.v.m. de privacy.

Federated learning is a een recent opgekomen veld waarin dit probleem wordt opgelost door de data niet langer meer direct te delen. In plaats van de data op een centrale locatie te verzamelen voor analyse, wordt de analyse als het ware naar de data gebracht. Iedere deelnemer voert lokaal deel berekeningen uit, waarna de resultaten op een veilige manier worden samen gevoegd. Op deze manier hoeft alleen het eindresultaat van de analyse te worden gedeeld, en kunnen de individuele data-eigenaren erop vertrouwen dat hun data beschermd blijft.

In deze hesis worden verschillende technieken voor federated learning besproken. De focus ligt op verticaal gedeelde data. Dit wil zeggen dat de de focus ligt op scenarios waarbij de betrokken organisaties verschillende soorten informatie verzamelen over dezelfde populatie. Dit gebeurt bijvoorbeeld wanneer men een gedeelde analyse wil uitvoeren op socio-economische data verzameld door het CBS, en medische data verzameld door een ziekenhuis.

Het onderzoek is bekostigt door het NWO en was onderdeel van het CARRIER project.

Daalen, F. van (2025). Privacy preserving vertically partitioned federated learning: New techniques and considerations. Dissertation, Maastricht University, doi:10.26481/dis.20250328fd.