Onderzoeksdata archiveren en publiceren

Aan het eind van je onderzoek moet je de data die ten grondslag liggen aan je publicatie minimaal 10 jaar archiveren. Een goede archivering bevordert de wetenschappelijke integriteit en maakt (intern) hergebruik mogelijk. Het draagt bij aan de vindbaarheid en bruikbaarheid van je onderzoek en daarmee aan de impact van je wetenschappelijke output. Het RDM-beleid van de Radboud Universiteit stelt ook dat je je data “as open as possible, and as closed as necessary” moet delen. Dit betekent dat je in de meeste gevallen (een deel van) je data moet publiceren. Zowel het archiveren in een gesloten omgeving voor wetenschappelijke integriteit als het publiceren vereisen vergelijkbare voorbereidingen: 

Beslis (open en/of gesloten archivering)

Het RDM-beleid van de Radboud Universiteit stelt: “Research data should be archived as open as possible, as closed as necessary. The starting point is that research data should be made publicly available.”Dit betekent dat je moet beslissen welk deel van je data open gearchiveerd (gepubliceerd) kan worden en welk deel in een gesloten archief thuishoort.

Vind een archief

Zodra je hebt besloten of je data in een gesloten en/of open archief thuishoren, moet je een geschikt archief vinden (of soms twee als je een open én een gesloten archief nodig hebt). Controleer eerst het RDM-beleid van je instituut of vraag een (senior) collega om advies. Zij kunnen je specifieke repositories aanraden die bekend zijn in jouw vakgebied. Kijk ook of je onderzoeksinstituut gebruik kan maken van de Radboud Data Repository (RDR). Als je de RDR gebruikt, voldoe je automatisch aan de standaarden van de Radboud Universiteit en de onderstaande eisen.

Betrouwbaar en FAIR-enabling

De repository van je keuze, of deze nu gesloten of open is, moet betrouwbaar zijn en de FAIR-principes (Findable, Acessible, Interopable en Reusable) toepassen. Het gebruik van een betrouwbare en FAIR-geschikte repository kan je data toekomstbestendiger maken en de impact van je wetenschappelijke werk vergroten. Dit laatste (FAIR-enabling) is bovendien verplicht door de Radboud Universiteit zoals gedefinieerd in het RDM beleidsdocument. 

Bereid je dataset voor

Zodra je een geschikte repository hebt gevonden, moet je je data voorbereiden op langdurige opslag, of dit nu gesloten archivering of publicatie is.

Voeg rijke metadata toe aan je dataset. Zorg voor een goede titel, voeg een uitgebreide beschrijving toe van de onderzoekscontext en de inhoud van de dataset, voeg trefwoorden toe en vul zoveel mogelijk van de andere metadatavelden in die het archief van je keuze biedt. Deze stap is essentieel voor de vindbaarheid en herbruikbaarheid van je dataset! Het is niet alleen belangrijk voor gepubliceerde datasets, maar ook voor gesloten gearchiveerde datasets, omdat die metadata het enige zichtbare en dus vindbare deel van je dataset kunnen zijn.

Documentatie toevoegen. Voeg voor vindbaarheid en herbruikbaarheid rijke documentatie toe over de context, kwaliteit en conditie, of kenmerken van de data. Meestal wordt dit gedaan in een readme(leesmij) -bestand dat deel uitmaakt van de metadata en openlijk toegankelijk is. Zie de pagina over het documenteren van data voor meer informatie.

Aanvullende FAIR-ificatie stappen:

  • Voor toegankelijkheid, zorg ervoor dat alle toegangsrechten duidelijk en correct geïmplementeerd zijn. Voor gesloten archivering betekent dit dat je ervoor moet zorgen dat degenen die toegang moeten hebben tot het archief, daadwerkelijk toegang hebben en niemand anders. Voor publicatie betekent dit dat je een passend toegangsniveau (Access level) en licentie of Data Use Agreement moet kiezen. Vergeet niet om je data “As open as possible, as closed as necessary” te publiceren;
  • Voor interoperabiliteit en herbruikbaarheid: Als je onderzoeksveld een vocabulaire heeft voor specifieke termen of concepten, gebruik die dan in je dataset en voeg informatie over het vocabulaire toe. Voeg anders documentatie toe om te verduidelijken wat je termen en concepten zijn (bijv. door een codeboek toe te voegen).

Let op: als je (delen van) je data publiceert, zorg er dan voor dat deze geen informatie bevatten die je niet mag delen onder het geselecteerde toegangsniveau, vooral als het gaat om persoonsgegevens. 

Meer informatie over anonimiseren en pseudonimiseren

Archiveer

Veel betrouwbare repositories controleren een dataset voordat deze wordt gepubliceerd om de kwaliteit van de repository en de datasets erin te waarborgen. Deze controles kunnen een beoordeling van persoonsgegevens, metadata, documentatie en/of bestandsformaten omvatten. Als gevolg hiervan kan het zijn dat het archief van je verlangt dat je wijzigingen aanbrengt in je dataset. Houd er rekening mee dat dit proces enkele dagen in beslag kan nemen, dus zorg ervoor dat je dit in je planning opneemt.
 

Contact

Als onderzoeker van de Radboud Universiteit kun je de trainingen Radboud Data Repository – Getting started en Radboud Data Repository – Archiving & Publishing van het Digital Competence Centre volgen. Meld je aan via gROW 

Heb je vragen over je onderzoek of over het Research Data Management beleid? Neem dan contact op met de data steward van jouw instituut.