Soms kun je bestaande data uit digitale of fysieke archieven of depots gebruiken om je onderzoeksvraag te beantwoorden. Zo kun je efficiënt gebruikmaken van data, werk en tijd besparen en toegang krijgen tot grotere datasets en/of participant pools dan je normaal zou hebben.
Bestaande data vinden
Om de kwaliteit van een digitaal archief te beoordelen, kun je het volgende controleren:
- Eventuele certificering, zoals de CoreTrustSeal en ISO of Nestor Seal DIN standaarden. Als een archief als betrouwbaar is gecertificeerd, is het minder of zelfs niet nodig om de volgende punten van deze lijst te controleren
- De missie, het beleid en de richtlijnen van het archief. Probeer een antwoord te vinden op vragen als: heeft het archief een lange termijn bewaardoelstelling? Onderschrijft het de FAIR-principes. Biedt het richtlijnen voor duurzame dataformaten en metadata standaarden? Wat is het beleid met betrekking tot toegangsbeheer en privacy?
- Het gebruik van persistent identifiers zoals DOI's, die de vindbaarheid van de data garanderen
- Het gebruik van licenties. Biedt de repository breed erkende (open access) licenties voor onderzoeksdata en -code? Biedt het de optie om overeenkomsten voor gegevensgebruik (Data Use Agreements) toe te voegen voor het delen van onderzoeksdata onder beperkte toegangsvoorwaarden?
Bronnen
Er zijn veel goede bronnen beschikbaar. Als je niet weet waar je moet beginnen, zijn websites met een lijst van repositories een goede optie, zoals Re3data.org, FAIRsharing en EOSC Portal.
Je kunt ook beginnen met het doorzoeken van de Radboud Data Repository (RDR). Deze repository bevat data uit verschillende onderzoeksgebieden, zoals geesteswetenschappen, sociale wetenschappen, levenswetenschappen, rechten en technische wetenschappen. Bovendien kan je zoektocht in de RDR leiden tot samenwerkingen met collega-onderzoekers van de Radboud Universiteit.
Voorwaarden bestaande data gebruiken
Wees je, nadat je een dataset hebt gevonden, bewust van alle voorwaarden en beperkingen voor toegang tot de data en hergebruik. Deze zijn vaak te vinden in een licentie of een Data Use Agreement. Als je zo'n document niet kunt vinden, neem dan contact op met de eigenaar van de data en vraag om opheldering. Controleer bij het lezen van een licentie of:
- Je de data mag bewerken, combineren en/of uitbreiden.
- Je de originele en/of afgeleide data mag publiceren. Je kunt nog steeds data gebruiken die je niet mag herpubliceren, maar als je je hiervan aan het begin van je project bewust bent, kun je dit duidelijk communiceren naar relevante partijen, zoals financiers of uitgevers.
- Je de licentie mag veranderen (als je de data opnieuw mag publiceren). Houd er rekening mee dat als je de oorspronkelijke licentie niet mag wijzigen, dit problemen kan opleveren als je meerdere datasets met verschillende licenties combineert.
- Je de originele auteur of bron moet vermelden in je eigen werk. Dit is natuurlijk gebruikelijk in de wetenschappelijke gemeenschap, maar sommige licenties vermelden dit specifiek. Zie hieronder voor meer details.
- Er andere beperkingen zijn. Sommige overeenkomsten voor het gebruik van data kunnen andere, minder algemene beperkingen bevatten, bijvoorbeeld dat het niet is toegestaan om de identiteit vast te stellen of contact op te nemen met deelnemers van het onderzoek.
Bestaande data citeren
Ongeacht de licentie-eisen is het altijd belangrijk om op de juiste manier te citeren. Net als bij artikelen geeft het citeren van een dataset de maker de juiste erkenning en maakt hun onderzoek beter vindbaar. Door een dataset te citeren, erken je ook dat datasets legitieme wetenschappelijke bijdragen zijn.
Een verwijzing naar een dataset moet bestaan uit:
- De namen en/of organisaties van de makers van de data;
- Het jaar waarin de data is gemaakt/verzameld;
- De titel;
- De naam van de uitgever;
- De persistente identifier als volledige URL.
Verder kan het versienummer en het type bron bevatten (bijv. dataset, software, workflow).