Data anonimiseren en pseudonimiseren

Door data te anonimiseren of te pseudonimiseren bescherm je de privacy van onderzoeksdeelnemers. Als je over persoonsgegevens beschikt, moet je deze zoveel mogelijk anonimiseren of pseudonimiseren terwijl je je onderzoeksvraag nog steeds kan beantwoorden.

Het verschil tussen anonimiseren en pseudonimiseren is dat anonieme data nooit herleid kunnen worden naar individuen, terwijl het bij gepseudonimiseerde data mogelijk blijft om de link tussen de data en individuen te herstellen, bijvoorbeeld via een sleutelbestand. Dit betekent dat gepseudonimiseerde data nog steeds als persoonsgegevens worden beschouwd en de AVG hierop van toepassing is.

De wetenschappelijke waarde van onderzoeksdata kan in het geding komen door anonimiseren of pseudonimiseren. Anonimiseer of pseudonimiseer daarom alleen in die mate dat (her)gebruik van de data nog mogelijk is. Dit kan betekenen dat onderzoeksdata niet geschikt zijn voor anonimisering of pseudonimisering en daardoor te gevoelig blijven om te delen of te publiceren.

Manieren om te anonimiseren en pseudonimiseren

Afhankelijk van jouw type onderzoeksdata kies je een manier om data te anonimiseren of pseudonimiseren. 

Er zijn tools voor het anonimiseren van data beschikbaar, zoals de ARX Anonymisation tool. Je kan onderzoeksdata ook handmatig anonimiseren of pseudonimiseren. Omdat anonimiseren en pseudonimiseren moeilijk kan zijn, kan je altijd de data steward van je instituut om hulp vragen.

Anonimiseren 

Bij anonimiseren verwijder je alle informatie die gebruikt kan worden om een individu direct of indirect te identificeren: 

  • Verwijder informatie die je niet gebruikt (noch voor het beantwoorden van je onderzoeksvraag, noch voor administratieve of andere doeleinden). Je mag nooit informatie verzamelen die je niet nodig hebt
  • Verwijder administratieve informatie wanneer je deze niet langer nodig hebt, bijvoorbeeld e-mailadressen of telefoonnummers om contact op te nemen met deelnemers
  • Vervang informatie die relevant is voor je onderzoeksvraag door een alternatief of in geaggregeerde vorm. Vervang bijvoorbeeld een adres door het dorp, de gemeente, de provincie of zelfs het land. Als dit niet mogelijk is, moet je waarschijnlijk je data pseudonimiseren

Pseudonimiseren 

Soms is anonimiseren niet mogelijk, omdat je dan informatie verliest die relevant is voor je onderzoeksvragen. Bijvoorbeeld als je longitudinaal onderzoek uitvoert of tijdelijk persoonlijke informatie nodig hebt om administratieve redenen. In die gevallen kun je je data pseudonimiseren door informatie die gebruikt kan worden om een individu te identificeren te scheiden van alle andere data:

  • Maak een sleutelbestand aan. Vervang alle identificeerbare informatie door pseudoniemen (bijv. deelnemerscodes) en maak een sleutelbestand dat die pseudoniemen koppelt aan de oorspronkelijke informatie die ze vervangen. Bewaar het sleutelbestand op een andere locatie dan de gepseudonimiseerde data. Als het sleutelbestand alleen administratieve persoonlijke data bevat, verwijder het dan zodra je het niet meer nodig hebt.
  • Niet alle persoonlijke informatie kan in één sleutelbestand worden opgeslagen. Sla in dergelijke gevallen de bestanden met persoonlijke gegevens apart van de rest op en zorg ervoor dat je de toegang tot de persoonlijke gegevens tot een minimum beperkt. Daarnaast kun je extra beveiligingsmaatregelen toevoegen, zoals versleuteling.

Contact

Als onderzoeker van de Radboud Universiteit kun je de training Introduction to Data Anonymisation van het Digital Competence Centre volgen. Meld je aan via gROW

Heb je vragen over je onderzoek of over het Research Data Management beleid? Neem dan contact op met de data steward van jouw instituut.

Heb je vragen over het gebruik van persoonsgegevens in onderzoek? Neem dan contact op met de lokale privacy officer binnen jouw faculteit of dienst.