1. Introductie
In 2013 heeft het College van Bestuur van de Radboud Universiteit een algemeen Research Data Management (RDM) beleid vastgesteld. Dit beleid bevat bepalingen over een goed beheer van onderzoeksgegevens die in onderzoek en onderwijs aan de Radboud Universiteit worden verzameld en verwerkt. Het RDM-beleid is verder uitgewerkt in de visie Op de kwaliteit van het onderzoek (2017) van de RDM-stuurgroep. Deze visie verwoordt de ambitie dat onderzoeksgegevens aan de Radboud Universiteit in 2020 worden beheerd en opgeslagen volgens de FAIR-principes. FAIR staat voor vindbaarheid, toegankelijkheid, interoperabiliteit en herbruikbaarheid van onderzoeksdata.
Sinds de vaststelling van het RDM-beleid zijn belangrijke stappen gezet naar goed databeheer volgens de FAIR-principes, onder meer bij de ontwikkeling en implementatie van beleid en systemen, en door het beschikbaar stellen van de benodigde ondersteuning. Tegelijkertijd is duidelijk geworden dat de uitvoering van FAIR-gegevensbeheer een langdurige ontwikkeling en een leerproces is. Ook is duidelijk geworden dat er tussen de vier afzonderlijke FAIR-beginselen verschillen bestaan wat betreft de moeilijkheidsgraad en de stand van de verwezenlijking ervan. De stuurgroep RDM is van mening dat de randvoorwaarden voor het realiseren van vindbaarheid (F) en goed toegangsbeheer (A) van onderzoeksgegevens bij de Radboud Universiteit inmiddels aanwezig zijn. Tot op zekere hoogte geldt dit ook voor de herbruikbaarheid (R) van onderzoeksgegevens, hoewel er zowel binnen als tussen wetenschappelijke disciplines grote verschillen bestaan in de mate waarin hergebruik en herbruikbaarheid van gegevens mogelijk en/of wenselijk worden geacht. Het bereiken van interoperabiliteit (I) van onderzoeksgegevens wordt nog vaak gezien als een complexe uitdaging.
Op basis van bovenstaande overwegingen hebben het College van Bestuur en het College van Decanen een richtlijn vastgesteld die instituten en onderzoekers verplicht om vanaf 2021 ten minste de vindbaarheid (F) en een goed toegangsbeheer (A) van onderzoeksgegevens behorende bij wetenschappelijke publicaties te waarborgen. Naast een beschrijving van deze richtlijn bevat deze notitie ook voorkeursopties voor manieren waarop onderzoekers en instituten aan deze richtlijn kunnen voldoen.
2. Doel van het RDM-beleid
Goed beheer van onderzoeksgegevens dient verschillende doelen. Ten eerste vereist het kunnen waarborgen van academische integriteit onder meer dat onderzoeksresultaten en bijbehorende onderzoeksgegevens verifieerbaar zijn. Dit vereist vindbaarheid en toegankelijkheid van bij publicaties behorende onderzoeksgegevens. Daarnaast stelt een goede registratie en archivering van onderzoeksgegevens andere onderzoekers in staat onderzoek te reproduceren of te repliceren. Naast wetenschappelijke integriteit komt dit ook de kwaliteit en betrouwbaarheid van onderzoek ten goede.
Ten tweede beoogt het RDM-beleid het hergebruik van onderzoeksgegevens te bevorderen. Het vindbaar, toegankelijk en begrijpelijk maken van onderzoeksgegevens voor andere onderzoekers draagt bij aan de mogelijkheden om deze onderzoeksgegevens te hergebruiken in ander onderzoek. Dit bevordert een efficiënt gebruik van onderzoeksmiddelen (tijd, geld, materialen, faciliteiten).
Een derde reden voor goed onderzoeksgegevensbeheer is dat dit de mogelijkheden vergroot om onderzoek te herkennen, te monitoren en er verantwoording over af te leggen. Datasets worden steeds meer erkend als onderzoeksoutput op zich, en goede archivering en registratie vergemakkelijkt de opname ervan in beoordelingen en evaluaties. Daarnaast wordt het delen van onderzoeksdata steeds meer gezien als een relevante open science-gerelateerde activiteit die wordt meegenomen in de erkenning en waardering van onderzoekers. Deze ontwikkeling zal de komende jaren naar verwachting veel belangrijker worden. Verder is centrale registratie van datasets belangrijk voor individuele instituten en de universiteit als geheel, om het databeheer te kunnen monitoren en daarover verantwoording af te leggen. Dit gebeurt bijvoorbeeld al door de registraties van datasets in RIS / Metis op te nemen in jaarverslagen van instituten.
Ten slotte wordt RDM steeds belangrijker in het nationale en internationale onderzoeksbeleid, en stellen onderzoeksfinanciers en wetenschappelijke tijdschriften steeds vaker eisen aan het archiveren en delen van onderzoeksgegevens. Ook dit is een reden om ervoor te zorgen dat de archivering en registratie van onderzoeksgegevens op orde is.
3. Instructie
Gelet op alle hierboven beschreven overwegingen en ontwikkelingen geldt vanaf 1 januari 2021 de volgende richtlijn voor RDM aan de Radboud Universiteit:
Van publicaties gebaseerd op onderzoeksgegevens, geschreven door een of meer onderzoekers van de Radboud Universiteit, moet duidelijk zijn hoe de bijbehorende gegevens gevonden kunnen worden, en het toegangsbeheer van deze gegevens moet goed geregeld zijn.
Vindbaarheid en toegankelijkheid worden hieronder nader toegelicht. Hierbij moet worden opgemerkt dat als de vindbaarheid (F) en toegankelijkheid (A) via een van de hieronder toegelichte voorkeursroutes zijn geregeld, de herbruikbaarheid (R) vaak al grotendeels op orde is. De richtlijn geldt zowel voor gegevens die geschikt zijn om openbaar te worden gedeeld, als voor gegevens die dat niet zijn, bijvoorbeeld uit privacyoverwegingen.
4. What do we mean by findable and accessible research data?
De hieronder beschreven uitwerking van vindbaarheid en toegankelijkheid is gebaseerd op de veelgebruikte definities van de FAIR-principes, die te vinden zijn in het invloedrijke artikel van Wilkinson en collega's uit 2016 en op de website van het GO FAIR initiatief. Een uitleg van FAIR is ook te vinden op de RDM website van de Radboud Universiteit.
Vindbaarheid betekent dat onderzoeksgegevens op een eenvoudige, eenduidige en blijvende manier gevonden kunnen worden, zowel binnen als buiten de organisatie. Interne vindbaarheid omvat bijvoorbeeld vindbaarheid voor collega's en vindbaarheid ten behoeve van het verzamelen van managementinformatie over RDM en onderzoeksresultaten. Externe vindbaarheid omvat bijvoorbeeld de vindbaarheid voor collega's die geïnteresseerd zijn in onderzoeksgegevens bij een publicatie, en de beschikbaarheid van datasets voor zoekmachines. Dit wordt als volgt mogelijk gemaakt:
- Aan datasets wordt een persistent identifier (PID) toegekend. Een PID is een permanente en unieke referentie die onafhankelijk is van de plaats waar de gegevens worden opgeslagen. Een bekend voorbeeld hiervan is de DOI. Bij gebruik van de RDR (Radboud Data Repository) wordt automatisch een PID toegekend aan een dataset. Dit geldt ook voor de DANS Datastations en veel disciplinaire dataopslagarchieven (repositories).
- Gegevens worden voorzien van rijke metadata. Onder metadata verstaan we de gegevens die eigenschappen van een data of een dataset beschrijven, zoals: titel, auteur, datum, beschrijvende aantekeningen en toepasselijke toegangsbeperkingen. Uitgebreide en gedetailleerde metadata vergroten de vindbaarheid van een dataset. Uitgebreide metagegevens zijn standaard vereist in de RDR. Beschrijvingen van de context, inhoud en eigenschappen van de gegevens, als onderdeel van de documentatie van een dataset, vallen ook onder rijke metagegevens.
- De PID maakt deel uit van de metagegevens die de gegevens beschrijven. In de RDR gebeurt dit automatisch.
- (Meta)gegevens worden geregistreerd of geïndexeerd in een doorzoekbare informatiebron. Dit betekent dat het gekozen archief en de inhoud ervan met gangbare zoekmachines (zoals Google Scholar) gevonden moeten kunnen worden. Dit is het geval met RDR, datasets die geregistreerd zijn in RIS en veel gecertificeerde repositories.
Toegankelijkheid betekent niet dat onderzoeksgegevens te allen tijde voor iedereen toegankelijk zijn, maar wel dat goed is vastgelegd en geregeld hoe en onder welke voorwaarden toegang tot de gegevens mogelijk is (goed toegangsbeheer). Dit wordt als volgt mogelijk gemaakt:
- De toegang tot (meta)gegevens wordt geregeld door middel van een gestandaardiseerd protocol, waar nodig met een toegangsprocedure. De RDR biedt hiervoor verschillende mogelijkheden, waaronder het archiveren van datasets voor alleen intern gebruik, en het beschikbaar stellen van data onder voorwaarden of embargo. Ook andere repositories, zoals een van de DANS-datastations, bieden hiervoor diverse mogelijkheden.
- De metadata zijn toegankelijk, ook als de gegevens niet meer beschikbaar zijn. Er komt meestal een moment dat onderzoeksgegevens worden verwijderd of bijgewerkt. Het is belangrijk om metadata te bewaren, omdat ze op zichzelf waardevol kunnen zijn.
5. Trajecten naar vindbare en toegankelijke onderzoeksgegevens
Er zijn verschillende mogelijkheden om ervoor te zorgen dat onderzoeksgegevens volgens de beginselen van vindbaarheid en toegankelijkheid worden opgeslagen. Bij voorkeur wordt een van de volgende routes gevolgd:
- De Radboud Data Repository (RDR) kan gebruikt worden voor het registreren en archiveren van gegevens die geschikt zijn om te delen, maar ook van gegevens die niet gedeeld kunnen worden. Met de RDR beschikt de Radboud Universiteit over een solide en moderne RDM-faciliteit voor het veilig en langdurig beheren, archiveren en delen van onderzoeksgegevens, documentatie en metadata gedurende alle fasen van het onderzoeksproces. De RDR bevat verschillende onderdelen (collecties) die geschikt zijn voor verschillende doeleinden, waaronder interne en gesloten archivering van datasets, en het breed beschikbaar stellen van onderzoeksdata. Bij gebruik van de RDR vindt registratie van de metadata van de dataset in Metis automatisch plaats. Het volgen van deze route heeft ook betrekking op de herbruikbaarheid van gegevens, omdat de RDR rijke metadata vereist en de dataset voorziet van een licentie voor datagebruik.
- Onderzoeksgegevens die geschikt zijn om te delen met andere onderzoekers (al dan niet onder bepaalde beperkingen of voorwaarden) kunnen worden gearchiveerd in een van de landelijke DANS Datastations. Naast het opslaan van de data in een DANS Datastation moeten de data geregistreerd worden in RIS.
- Onderzoekers of instituten kunnen ervoor kiezen een ander (bijvoorbeeld disciplinair) depot te gebruiken voor de archivering van onderzoeksgegevens. In dat geval is het aan de betrokkenen (onderzoeker, instituut, data steward) om ervoor te zorgen dat deze repository voldoet aan de hierboven beschreven richtlijnen voor vindbaarheid en toegankelijkheid.
Naast het opslaan van de gegevens in de repository van keuze, moeten de metadata worden geregistreerd in RIS. Naast bovengenoemde voorkeursroutes kunnen er ook andere manieren zijn waarop onderzoekers of instellingen hun (meta)data willen opslaan en vindbaar en toegankelijk willen maken. Dit is mogelijk, zolang ze voldoen aan de hierboven beschreven richtlijnen met betrekking tot vindbaarheid en toegankelijkheid. Ongeacht de gekozen route acht de stuurgroep RDM het onvermijdelijk dat metadata worden geregistreerd in RIS / Metis. Hiervoor zijn hierboven verschillende argumenten gegeven, waaronder het waarborgen van de vindbaarheid van data, het koppelen van datasets in Metis aan andere onderzoeksoutput, en het mogelijk maken van monitoring en verantwoording (op instituutsniveau en centraal) met betrekking tot RDM. Het niet registreren van metadata in RIS wordt alleen toelaatbaar geacht als dit overtuigend kan worden gemotiveerd. Registratie in RIS / Metis vindt standaard plaats in de eerste twee hierboven beschreven routes.
4. Uitvoeringshandelingen
De volgende acties worden uitgevoerd om de vindbaarheid en toegankelijkheid van onderzoeksgegevens aan de Radboud Universiteit vanaf 2021 te garanderen:
- De instituten maken een expliciete keuze, indien zij dit nog niet hebben gedaan, voor één of meer van de hierboven beschreven trajecten. In sommige gevallen vereist dit een aanpassing van onderdelen van het RDM-beleid van het instituut.
- Indien een instituut kiest voor een route die niet onder de bovengenoemde routes 1 t/m 3 valt, zullen de data steward en onderzoeksdirecteur van het instituut, RDM-ondersteuning en de RDM-stuurgroep bespreken hoe de vindbaarheid en toegankelijkheid van onderzoeksdata kan worden gewaarborgd.
- Vanaf 2020 wordt in de jaarverslagen van de onderzoeksinstellingen verantwoording afgelegd over ten minste de vindbaarheid en toegankelijkheid en eventueel de interoperabiliteit en herbruikbaarheid van onderzoeksgegevens. Deze verantwoording wordt toegevoegd aan de verantwoording van in RIS / Metis geregistreerde datasets die al in de jaarverslagen is opgenomen.
- Duidelijke informatie voor en adequate ondersteuning van onderzoekers met betrekking tot de richtlijn (wat wordt van hen verwacht, hoe kunnen zij aan de richtlijn voldoen) worden verzorgd door Radboud Services, in afstemming met de stuurgroep RDM.