De meeste subsidieverstrekkers gebruiken de FAIR-principes, die stellen dat uw onderzoeksdata vindbaar, toegankelijk, uitwisselbaar en herbruikbaar moeten zijn. Het is nuttig dit in gedachten te houden bij het schrijven van uw datamanagementparagraaf. Deze uitgangspunten gelden over het algemeen voor de opslag van je data op de lange termijn.
In je datamanagementparagraaf kun je de FAIR-principes toepassen door de databank te noemen die je hebt gekozen voor de opslag van je data en de volgende aspecten te vermelden:
Vindbaar: Hoe kunnen derden de data gemakkelijk vinden?
- Krijgen uw data een Persistent Identifier (bijv. een DOI)?
- Heeft de databank specifieke metadatastandaarden (bv. Dublin Core of DataCite)? Zo niet, kun je zelf metadata toevoegen zoals een samenvatting, trefwoorden, auteurs, etc.?
- Wordt de databank geïndexeerd door zoekmachines, bijvoorbeeld op Google Scholar?
Toegankelijk: Hoe is de toegang tot de data gereguleerd?
Houd er rekening mee dat toegankelijke data niet automatisch betekent dat ze open of vrij toegankelijk zijn. Ook data die met gesloten en/of beperkte toegang worden gepubliceerd kunnen FAIR zijn. Hoewel open access aan de Radboud Universiteit gestimuleerd wordt, kunnen er ethische of juridische redenen zijn om (delen van) uw data niet open access te maken. Dit betekent dat als je goede redenen hebt om je data onder beperkte toegang te publiceren of om je data helemaal niet te publiceren, je die redenen en de geldende protocollen kunt vermelden. Ongeacht hoe open u van plan bent uw data te publiceren, de volgende punten hebben betrekking op toegankelijkheid:
- Zijn er beperkingen voor wie toegang kan krijgen tot de data? Is er sprake van overeenkomsten of licenties voor het gebruik van data?
- \Als de gegevens zelf niet toegankelijk zijn (bijvoorbeeld om ethische of juridische redenen), zijn de metadata dan toegankelijk?
- Vermeld hoe lang de data worden bewaard. De Radboud Universiteit heeft als beleid dat alle onderzoeksdata om redenen van wetenschappelijke integriteit ten minste 10 jaar moeten worden bewaard.
Uitwisselbaar: Kunnen mensen en computers de data interpreteren en combineren met andere datasets?
- Indien aanwezig in het vakgebied, maakt u in uw metadata gebruik van standaardvocabulaires, ontologieën en/of een begrippenlijst?
- Vermeld of je waar mogelijk zult proberen interoperabele bestandsformaten te gebruiken. In het algemeen wordt de voorkeur gegeven aan interoperabele bestandsformaten die algemeen worden gebruikt en vrij toegankelijk zijn. Zo verdienen .odt (Open Document Text) of .pdf de voorkeur boven .docx-bestanden, aangezien Microsoft Word niet gratis te gebruiken is en mogelijk niet voor iedereen beschikbaar is (nu of in de toekomst).
Herbruikbaar: Hoe wordt de data beschikbaar gemaakt voor (her)gebruik door derden?
- Wordt er een goede documentatie meegeleverd, zoals een readme, codeboek of methodieken?
- Je kunt eventuele overeenkomsten of licenties voor het gebruik van data vermelden waaronder je je data zult delen. De CC BY 4.0 licentie is bijvoorbeeld een veelgebruikte licentie. Sommige databanken geven standaardlicenties uit die bij uw dataset horen.
- Als u met specifieke software werkt, bijvoorbeeld voor uw analyses, leg dan uit hoe en waar de software beschikbaar is en als deze niet algemeen beschikbaar is, hoe u daarmee omgaat. Bijvoorbeeld door uw software te publiceren naast uw data wanneer dat mogelijk is. Als u geen speciale software gebruikt, vermeld dan dat alle data geopend kunnen worden met algemeen beschikbare software.
Voorbeeldtekst
"Het is het beleid van de Radboud Universiteit in het algemeen en ons onderzoeksinstituut [naam onderzoeksinstituut] in het bijzonder om te voldoen aan de FAIR-principes en alle data verkregen in onderzoeksprojecten te delen met de wetenschappelijke gemeenschap, zolang ethische en wettelijke voorschriften dit toestaan. In overeenstemming met het beleid van de universiteit inzake het beheer van onderzoeksgegevens (RDM) zullen alle onderzoeksgegevens om redenen van wetenschappelijke integriteit gedurende 10 jaar na voltooiing van het project worden gearchiveerd. Waar mogelijk worden data gearchiveerd via de Radboud Data Repository. Via deze archiveringsfaciliteiten zullen data (1) vindbaar zijn door indexering van data door zoekmachines op het internet, inclusief rijke metadata volgens de Dublin Core en DataCite schema's, en een persistente identifier (DOI) ontvangen, (2) toegankelijk door gebruik te maken van een open internet protocol, inclusief duidelijke autorisatieprocedures, en waar mogelijk zullen de data gedeeld worden bij publicatie van gerelateerde artikelen onder een open access licentie, (3) interoperabel door normen voor metadata te gebruiken (Dublin Core/DataCite), door documentatie toe te voegen (codebook en readme), door voorkeursformaten te gebruiken, en door een standaardvocabulaire te gebruiken indien beschikbaar, en (4) herbruikbaar door rijke metadata op te nemen, ervoor te zorgen dat alle gegevens kunnen worden geopend en gebruikt door algemeen beschikbare software(analyse)instrumenten, door documentatie toe te voegen met instructies voor hergebruik, en door te publiceren onder een open access licentie."
Indien van toepassing kan ook deze toevoeging aan de bovenstaande voorbeeldtekst worden opgenomen:
"Alle data die om juridische of ethische redenen niet geschikt zijn voor hergebruik, worden gedurende 10 jaar bewaard, maar worden na onderzoek niet openbaar gemaakt. [Gelieve de redenen hiervoor toe te lichten. Juridisch is het misschien niet mogelijk om data te delen vanwege eigendoms- of intellectuele-eigendomsrechten. Ethische redenen betreffen bijvoorbeeld de privacy van deelnemers of vertrouwelijkheid]. Eventuele toegang tot deze vormen van gegevens en de opslag en verwerking ervan zullen in overeenstemming zijn met de privacyvereisten van de EU GDPR-richtlijn."