Richtlijn beheer van onderzoeksdata

1. Preambule

Goed beheer van onderzoeksdata (research data management, RDM) is om meerdere redenen van belang. Ten eerste is het voor het waarborgen van wetenschappelijke integriteit noodzakelijk dat onderzoeksresultaten controleerbaar zijn. Voor deze controleerbaarheid zijn de vindbaarheid en toegankelijkheid van onderzoeksdata vereisten.

Ten tweede stellen vindbare en toegankelijke onderzoeksdata andere onderzoekers in staat om onderzoek, waar mogelijk, te reproduceren of repliceren. Dit draagt bij aan de kwaliteit van wetenschappelijk onderzoek.

Ten derde draagt goed beheer van onderzoeksdata bij aan de mogelijkheden tot hergebruik van deze gegevens. Het vindbaar, toegankelijk en begrijpelijk maken van onderzoeksdata voor andere onderzoekers draagt bij aan de mogelijkheden om deze onderzoeksdata opnieuw, in ander onderzoek, te gebruiken. Dit bevordert efficiënt en doelmatig gebruik van onderzoeksmiddelen.

Een vierde reden om aan goed gegevensbeheer te doen, is dat dit de mogelijkheden tot erkenning en verantwoording van onderzoek vergroot. Datasets worden in toenemende mate erkend als op zichzelf staande onderzoeksoutput, en kunnen door goede archivering en registratie beter worden meegewogen in beoordelingen en evaluaties van onderzoek.

Een vijfde aspect dat van belang is, is privacy. Goed beheer van onderzoeksdata is nodig om zorg te kunnen dragen voor de adequate verwerking, opslag en archivering van privacygevoelige informatie die in het kader van wetenschappelijk onderzoek verzameld wordt. Daarmee draagt RDM ook bij aan ethisch verantwoord onderzoek.

Ten slotte speelt mee dat RDM steeds belangrijker wordt in nationaal en internationaal onderzoeksbeleid, en dat onderzoeksfinanciers en wetenschappelijke tijdschriften in toenemende mate eisen stellen op het gebied van de archivering en toegankelijkheid van onderzoeksdata. Ook dit is een reden om de archivering en registratie van onderzoeksdata goed op orde te hebben.

2. Wettelijke en beleidsmatige kaders

Deze richtlijn is een nadere uitwerking van, dan wel aanvulling op, de volgende wettelijke en beleidsmatige kaders:

  • De strategie van de Radboud Universiteit op het gebied van onderzoek en impact in het algemeen, en open science in het bijzonder.
  • De Nederlandse Gedragscode Wetenschappelijke Integriteit.
  • De Algemene Verordening Gegevensbescherming (AVG).
  • Het promotiereglement van de Radboud Universiteit.
  • Richtlijnen van de Radboud Universiteit op het gebied van kennisveiligheid.
  • Vereisten van onderzoeksfinanciers en wetenschappelijke tijdschriften ten aanzien van het beheer van onderzoeksdata.


3. Algemene principes voor het beheer van onderzoeksdata aan de Radboud Universiteit

Voor het beheer van onderzoeksdata aan de Radboud Universiteit gelden de volgende algemene principes:

  1. Het schrijven van een datamanagementplan (DMP), voorafgaand aan een onderzoek waarin onderzoeksdata worden verzameld, wordt aangeraden. Onderzoeksinstituten bepalen in hun eigen RDM-beleid of, en zo ja in welke gevallen, het schrijven van een datamanagementplan verplicht is. Deze eventuele verplichting is dan in aanvulling op de vereisten van onderzoeksfinanciers ten aanzien van datamanagementplannen.
  2. Onderzoeksdata die tijdens het uitvoeren van onderzoek worden verzameld en verwerkt, worden opgeslagen op een faciliteit die adequaat is met het oog op beschikbaarheid (de data gaan niet onbedoeld verloren), integriteit (de data worden niet onbedoeld gemodificeerd) en vertrouwelijkheid (de data zijn niet onbedoeld beschikbaar voor onbevoegden).
  3. Onderzoeksdata worden zo open als mogelijk, zo gesloten als nodig gearchiveerd. Het publiek beschikbaar maken van onderzoeksdata geldt als uitgangspunt. Van dit uitgangspunt wordt alleen afgeweken als dit noodzakelijk is vanwege privacy, kennisveiligheid, of andere zwaarwegende redenen. Onderzoeksinstituten specificeren in hun RDM-beleid, indien relevant, de voorwaarden voor het open dan wel afgesloten archiveren van onderzoeksdata.
  4. Onderzoeksdata behorend bij wetenschappelijke publicaties voldoen aan de vereisten van vindbaarheid en toegankelijkheid. Van op onderzoeksdata gebaseerde wetenschappelijke publicaties, waarvan één of meer onderzoekers van de Radboud Universiteit auteur zijn, moet duidelijk zijn hoe de bijbehorende data te vinden zijn en moet het toegangsbeheer van deze data goed geregeld zijn. Aan deze vereisten dient binnen een zo kort mogelijke redelijke termijn na het voltooien van de dataverzameling worden voldaan, en uiterlijk vanaf het moment waarop de eerste wetenschappelijke publicatie op basis van de onderzoeksdata beschikbaar is. Een nadere toelichting hiervan staat in bijlage 1.
  5. De minimale bewaartermijn van onderzoeksdata die nodig zijn om wetenschappelijke publicaties te kunnen controleren of verifiëren is 10 jaar vanaf het moment waarop de wetenschappelijke publicatie beschikbaar is.

4. Systemen en ondersteuning voor onderzoeksdata

De Radboud Universiteit voorziet in systemen en ondersteuning voor het verwerken, opslaan, archiveren, publiceren en registreren van onderzoeksdata. Onderzoeksinstituten hebben de vrijheid om keuzes te maken ten aanzien van de systemen die zij voor het beheer van onderzoeksdata gebruiken, zolang zij hiermee kunnen voldoen aan de voorliggende richtlijn.

De Radboud Universiteit voorziet in ondersteuning, kennis en advies voor onderzoekers op het gebied van het beheer van onderzoeksdata.

5. Verantwoordelijkheden van onderzoeksinstituten

Elk onderzoeksinstituut van de Radboud Universiteit heeft een eigen beleid voor het beheer van onderzoeksdata. Het RDM-beleid van het onderzoeksinstituut is een nadere uitwerking van de voorliggende richtlijn, die passend is voor de onderzoeksgebieden waarin het onderzoeksinstituut participeert.

De onderzoeker en projectleider zijn primair verantwoordelijk voor goed beheer van onderzoeksdata en volgen hierbij het beleid van het onderzoeksinstituut en, bij promotieonderzoek, het promotiereglement. De onderzoeksdirecteur is verantwoordelijk voor het ontwikkelen, vaststellen en eventueel aanpassen van het RDM-beleid van het onderzoeksinstituut, en het toezien op de implementatie en naleving daarvan.

Elk onderzoeksinstituut heeft één of meerdere data stewards. De data stewards adviseren onderzoekers en het bestuur van het onderzoeksinstituut over beheer van onderzoeksdata en de implementatie en naleving van het RDM-beleid van het onderzoeksinstituut. Ook informeren zij onderzoekers over de beschikbare faciliteiten op het gebied van onderzoeksdata en privacy. Een nadere uitwerking van taken en verantwoordelijkheden van data stewards is opgenomen in bijlage 2.

6. Beheer van onderzoeksdata in het kader van promotieonderzoek

Voor het beheer van onderzoeksdata in het kader van promotieonderzoek gelden aanvullende eisen. Deze eisen zijn opgenomen in het promotiereglement van de Radboud Universiteit.

7. Beheer van onderzoeksdata in het onderwijs

De onderzoeksdata behorend bij Bachelor- en Masterscripties worden opgeslagen op een faciliteit die adequaat is met oog op beschikbaarheid (de data gaan niet onbedoeld verloren), integriteit (de data worden niet onbedoeld gemodificeerd) en vertrouwelijkheid (de data zijn niet onbedoeld beschikbaar voor onbevoegden). De Radboud Universiteit biedt een hiertoe geschikt systeem aan. Het gebruik van dit systeem door onderwijsinstituten is optioneel.

De bewaartermijn voor bij Bachelor- en Masterscripties behorende onderzoeksdata is gelijk aan de wettelijke bewaartermijn voor scripties, te weten zeven jaar.

In het bachelor- en masteronderwijs is er aandacht voor RDM, op een manier die past bij het vakgebied en de fase van de studie. Bachelor- en masterscripties bevatten een verantwoording van het beheer van de bij de scriptie behorende onderzoeksdata.

De onderwijsdirecteur is verantwoordelijk voor de implementatie van en het toezien op de naleving van het RDM-beleid, voor zover dit op het wetenschappelijk onderwijs betrekking heeft.

Het is ook mogelijk dat onderzoeksdata behorend bij Bachelor- en Masterscripties onderdeel zijn van het onderzoek van een onderzoeker of projectleider. In dat geval gelden de algemene principes van beheer van onderzoeksdata binnen het wetenschappelijk onderzoek, zoals in voorgaande paragrafen beschreven.

Bijlage 1: vindbaarheid, toegankelijkheid, interoperabiliteit en herbruikbaarheid (FAIR)

Vindbaarheid en toegankelijkheid van onderzoeksdata zijn vereisten in het RDM-beleid van de Radboud Universiteit. De definities van deze vereisten zijn gebaseerd op de gangbare definities van de FAIR-principes (findable, accessible, interoperable, reusable). Deze zijn te vinden in het invloedrijke artikel van Wilkinson en collega’s (2016)[1] en op de website van het GO FAIR-initiatief[2]. Een toelichting van FAIR is ook te vinden op de RDM-website van de Radboud Universiteit.

Vindbaarheid houdt in dat onderzoeksdata op een eenvoudige, ondubbelzinnige en duurzame manier te vinden zijn, zowel binnen als buiten de organisatie, ook door anderen dan de onderzoeker zelf. Bij interne vindbaarheid valt bijvoorbeeld te denken aan vindbaarheid voor collega’s, en aan vindbaarheid ten behoeve van het vergaren van managementinformatie over RDM en onderzoeksoutput. Bij externe vindbaarheid valt bijvoorbeeld te denken aan vindbaarheid voor vakgenoten die geïnteresseerd zijn in bij een publicatie behorende onderzoeksdata, en aan het vindbaar zijn van datasets voor zoekmachines. Dit wordt als volgt mogelijk gemaakt:

  • Aan datasets wordt een persistent identifier (PID) toegewezen. Een PID is een permanente en unieke verwijzing die onafhankelijk is van de locatie van gegevensopslag. Een bekend voorbeeld hiervan is de DOI.
  • Data zijn voorzien van rijke metadata. Onder metadata verstaan we de gegevens die eigenschappen van data of een dataset beschrijven, zoals bijvoorbeeld titel, auteur, datum, beschrijvende notities en geldende toegangsbeperkingen. Uitgebreide en gedetailleerde metadata vergroten de vindbaarheid van een dataset. Beschrijvingen van de context, inhoud en eigenschappen van de data, als onderdeel van de documentatie van een dataset, vallen ook onder rijke metadata.
  • De PID van de dataset is onderdeel van de metadata die de data beschrijven.
  • (Meta)data worden geregistreerd of geïndexeerd in een doorzoekbare informatiebron. Deze registratie of indexering maken het mogelijk om via gangbare zoekmachines (bijvoorbeeld Google Scholar) het gekozen archief en de inhoud hiervan te vinden.

Bij toegankelijkheid gaat het er niet om dat onderzoeksdata te allen tijde voor iedereen toegankelijk zijn, maar dat goed is geregeld en vastgelegd is hoe en onder welke voorwaarden toegang tot de data mogelijk is (goed toegangsbeheer). Dit wordt als volgt mogelijk gemaakt:

  • De toegang tot (meta)data is geregeld door middel van een gestandaardiseerd protocol, waar nodig met een toegangsprocedure.
  • De metadata blijven bewaard, ook wanneer de volledige dataset niet meer beschikbaar is.[3] Dit maakt het mogelijk om ook op de lange termijn nog onderzoekers, organisaties en publicaties te kunnen vinden die aan het oorspronkelijke onderzoek gerelateerd zijn..

De Radboud Universiteit streeft naar interoperabiliteit en herbruikbaarheid van onderzoeksdata. Echter, dit zijn op dit moment geen vereisten in het RDM-beleid van de Radboud Universiteit. Interoperabiliteit houdt in dat data te interpreteren en combineren zijn, zowel door mensen als geautomatiseerd. Herbruikbaarheid houdt in dat data en metadata zo goed zijn beschreven en van toelichtende informatie voorzien, dat het opnieuw gebruiken, repliceren en combineren van de data in verschillende contexten en situaties mogelijk is.

[1] Wilkinson, M.D. et al. (2016) The FAIR Guiding Principles for scientific data management and stewardship, Scientific Data 3, Article number: 160018. https://doi.org/10.1038/sdata.2016.18

[2] www.go-fair.org

[3] Zie voor een nadere toelichting over metadata: https://www.go-fair.org/fair-principles/f2-data-described-rich-metadata/

 

Bijlage 2: taken en verantwoordelijkheden van data stewards

Elk onderzoeksinstituut van de Radboud Universiteit heeft één of meerdere data stewards. Onderstaand overzicht vat hun werkzaamheden samen, waarbij onderscheid wordt gemaakt tussen essentiële taken en verantwoordelijkheden en optionele activiteiten. Essentiële taken en verantwoordelijkheden zijn van toepassing op alle data stewards van de Radboud Universiteit, optionele taken en verantwoordelijkheden kunnen door een deel van de datastewards worden uitgevoerd.

Essentiële taken: wat doet een data steward aan de Radboud Universiteit in elk geval?

  • Het adviseren van onderzoekers over het beheer en de opslag van onderzoeksdata gedurende het onderzoek en voor de langere termijn, inclusief het eventueel publiceren van data.
  • Actief bijdragen aan de uitvoering en verdere verbetering van RDM binnen het eigen instituut.
  • Actief bijdragen aan de implementatie van het RDM-beleid van het instituut en indien nodig voorstellen doen om het beleid te actualiseren.
  • De naleving van het RDM-beleid binnen het instituut ondersteunen en een algemeen beeld hebben van deze naleving.
  • Op de hoogte zijn van ethische en juridische vraagstukken met betrekking tot onderzoeksdata in het eigen vakgebied, onderzoekers kunnen doorverwijzen naar de relevante adviseurs en commissies op dit gebied.
  • Het bestuur van het onderzoeksinstituut informeren over de implementatie en naleving van het RDM-beleid van het instituut.
  • Op de hoogte blijven van nieuwe ontwikkelingen en participeren in activiteiten en initiatieven binnen de Radboud Universiteit op het gebied van RDM.

Optionele taken: welke taken kunnen bij het werk van een data steward horen, maar behoren niet tot het standaard takenpakket?

  • Feedback geven op datamanagementplannen en datamanagementparagrafen.
  • Adviseren over het verzamelen van data, inclusief hergebruik van bestaande data.
  • RDM-werkprocessen ontwikkelen.
  • RDM-trainingen of cursussen organiseren.
  • Producten voor RDM-ondersteuning ontwikkelen en actualiseren, zoals websites, handleidingen, cursusmaterialen, demo’s en e-learningmodules.
  • Monitoren of datamanagementplannen geschreven worden.
  • De naleving van de FAIR principes monitoren.
  • Monitoren van de langetermijnarchivering van data.
  • Monitoren of data door actieve stafleden worden beheerd; zorg dragen voor een goede overdracht bij vertrek van werknemers.
  • Mogelijke privacy- en veiligheidsrisico’s identificeren, mede in het kader van de AVG.
  • Advies geven over RDM aan het faculteitsbestuur.
  • Projectregistratie faciliteren.