Algemeen beleid opslag en beheer van onderzoeksgegevens

Voorwoord

Aan de Radboud Universiteit gegenereerde onderzoeksgegevens worden opgeslagen, beheerd en toegankelijk gemaakt in overeenstemming met wettelijke, academische en ethische eisen en de eisen van financiële verstrekkers. Het beleid van de universiteit weerspiegelt de nationale en Europese ontwikkelingen op het gebied van gegevensbeheer en -opslag.

Toelichting

Paragraaf 3.4 van het eindrapport van de universitaire werkgroep voor academische integriteit stelt dat validatie van resultaten en/of de gegevens/bronnen waarop zij zijn gebaseerd een academisch beginsel is. Er bestaat een relatie tussen het zorgvuldig omgaan met onderzoeksgegevens en integer academisch handelen. De Radboud Universiteit weerspiegelt dit principe in het geformuleerde beleid met de ambitie dat al het gepubliceerde onderzoek herhaalbaar is.

Verder is dit beleid een uitwerking van het principe van "validatie" in de "Nederlandse Gedragscode Wetenschapsbeoefening". Het verband met wettelijke eisen heeft te maken met databankenrecht, auteursrecht en de Wet bescherming persoonsgegevens.

Uit onderzoek in zeven Europese landen blijkt dat 48% van de financiële aanbieders beleid voert ten aanzien van gegevensbeheer en -opslag, terwijl nog eens 20% plannen heeft om binnen twee jaar een beleid te ontwikkelen. De Nederlandse Organisatie voor Wetenschappelijk Onderzoek eist "goede en toegankelijke documentatie en opslag van gegevens". De European Research Council (ERC) eist dat gegevensopslag bij voorkeur direct na publicatie of maximaal binnen zes maanden na publicatie plaatsvindt. De aansluiting op nationale en Europese ontwikkelingen heeft te maken met de organisatie van gegevensopslag, technologische ontwikkelingen op het gebied van digitale media en kosteneffectiviteit. De beginselen van validatie en reproduceerbaarheid impliceren dat opslag op een pc/laptop of een mobiel apparaat geen optie is.

Artikel 1

Gegevens worden uiterlijk op het moment van publicatie van het onderzoek (inclusief dissertaties) opgeslagen, samen met ten minste alle informatie die nodig is voor mogelijk hergebruik van gegevens (metadata).

Toelichting

Het is essentieel dat bij de opslag van gegevens ook metagegevens worden verstrekt, zodat gegevensreeksen kunnen worden gevonden, onderscheiden van verwante gegevensreeksen en hergebruikt. Voorbeelden van metadata zijn: identificatie van het project en de onderzoeker, methoden van dataverzameling, type data, en opslaglocatie. Het hier geformuleerde beleid is een eerste stap. Uiteindelijk zullen gegevens tijdens het onderzoek moeten worden opgeslagen ter bescherming tegen onder meer verlies en vervorming. Voor aanvang van de dataverzameling moet een plan voor databeheer worden opgesteld. Dit Data Management Plan (DMP) helpt vooraf vast te stellen welke voorzieningen nodig zullen zijn en waar mogelijke valkuilen kunnen optreden bij het omgaan met onderzoeksgegevens. Het DMP beschrijft welke soorten gegevens worden verzameld en hoe groot en in welk formaat, hoe en waar de gegevens worden opgeslagen, welke vorm van metadata wordt gebruikt en wie toegang heeft tot de gegevens. De Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) overweegt de mogelijkheid om onderzoekers te verzoeken bij alle projectaanvragen specifiek aandacht te besteden aan een datamanagementplan. Goedkeuring van het datamanagementplan zou een voorwaarde kunnen zijn voor de eventuele toekenning van subsidies. Naar verwachting zal de EU die voorwaarde ook stellen (Horizon 2020).

Artikel

De gegevens van goedgekeurde bachelor- en masterscripties worden opgeslagen.

Toelichting

In het eindrapport van de universitaire werkgroep voor academische integriteit staat het volgende: "De scriptiefase van de bachelor en master en die van het proefschrift is een toets om te beoordelen of de student werkelijk over de eerder geleerde vaardigheden beschikt. Daarom moet elke scriptie en elk proefschrift het hoofdstuk 'verantwoording van de gebruikte methode' bevatten. Dit hoofdstuk moet ten minste bevatten waarom de gebruikte methode is gekozen, hoe proefpersonen/gegevens zijn verkregen, hoe de gegevens zijn verwerkt en geanalyseerd, en waar ze zijn opgeslagen. Dit geldt ook wanneer het eindproduct een artikel is.

Artikel 3

De bewaartermijn voor onderzoeksgegevens is minimaal tien jaar.

Toelichting

De minimale bewaartermijn voor de Radboud Universiteit is langer dan de wetenschapscode voorschrijft. Per discipline kan een langere minimumtermijn worden gehanteerd. Een maximumtermijn kan niet worden vastgesteld, omdat deze afhankelijk is van de discipline (zie art. 7). Uit bovengenoemd Europees onderzoek blijkt dat 74% van de financiers geen vaste bewaartermijn voorstelt.

Artikel 4

De primaire verantwoordelijkheid voor gegevensopslag en goed gegevensbeheer ligt bij de onderzoeker/projectleider. De directeur van het onderzoeksinstituut is eindverantwoordelijk voor dataopslag door medewerkers aan onderzoek dat onder zijn verantwoordelijkheid valt. De directeur onderwijs is eindverantwoordelijk voor dataopslag van goedgekeurde bachelor- en masterscripties.

Artikel

De universiteit is zich bewust van de vereiste voorwaarden voor een goed gegevensbeheer:

a) Het verschaffen van kennis, advies en begeleiding ten behoeve van databeheer en het verzorgen van een databeheerplan.

b) Voorzien in een adequate infrastructuur voor gegevensopslag en -beheer, tijdens en na het onderzoek, voor zover de onderzoekers zelf geen adequate alternatieve voorzieningen voor gegevensopslag hebben georganiseerd.

Toelichting

De UB biedt ondersteuning bij het opzetten van metadata en het opstellen van een DMP. Een aantal disciplines en onderzoeksthema's maakt al gebruik van nationale en internationale repositories en data-archieven (DANS, MPI, 3TUdatacentrum, SARA, CLARIN). Wanneer dit nog niet mogelijk is, zal een lokale data-infrastructuur noodzakelijk zijn.

Een adequate infrastructuur biedt garanties tegen verlies en ongevraagde toegang. Nationale en Europese ontwikkelingen wijzen op een zekere taakverdeling: nationale en internationale systemen voor langetermijnopslag, en lokale systemen voor datasets tijdens en direct na onderzoek ten behoeve van bijvoorbeeld replicatie. Eerder onderzoek suggereert dat een gecentraliseerde dienst voor databeheer aan de Radboud Universiteit kosteneffectiever zou zijn dan beheer op instellingsniveau. Het project Research Data Management biedt de mogelijkheid om diepgaander onderzoek te doen naar een voor de Radboud Universiteit optimale wijze van databeheer en -opslag.

Artikel 6

Een lijst van opgeslagen gegevensreeksen zal worden opgenomen in de zelfevaluatie van het standaardevaluatieprotocol.

Toelichting

De onderzoeksinstelling kan zowel in de mid-term review als in de zelfevaluatie die voorafgaat aan de externe evaluatie ingaan op haar beleid inzake gegevensopslag en -beheer. De Koninklijke Nederlandse Akademie van Wetenschappen heeft onlangs een wijziging van het Standard Evaluation Protocol aanbevolen die erop gericht moet zijn "dat visitatiecommissies nagaan of regelgeving en procedures op orde zijn, of de vereiste infrastructuur van mensen en faciliteiten beschikbaar is en of onafhankelijke wetenschapsbeoefening de norm is". In reactie op deze aanbeveling benadrukt de minister van Onderwijs, Cultuur en Wetenschap dat het onderwerp integriteit moet worden meegenomen in de evaluatie van de kwaliteit. In wetenschappelijke publicaties wordt regelmatig verwezen naar datasets. Verschillende landen gebruiken het aantal keren dat een dataset wordt geraadpleegd als indicator voor de kwaliteit van de dataset.

Artikel 7

Het universitaire beleid inzake de opslag en het beheer van onderzoeksgegevens zal door elk onderzoeksinstituut worden aangevuld.

Toelichting

Het beleid van het onderzoeksinstituut moet afspraken bevatten over ten minste:

  • de verantwoordelijkheden binnen het instituut voor het beheer en de opslag van gegevens;
  • welke gegevens worden opgenomen;
  • hoe metadata worden vastgelegd, waarbij zoveel mogelijk wordt aangesloten bij de standaard en best practices die voor het vakgebied gelden;
  • waar de gegevens voor zowel de lange als de korte termijn worden opgeslagen
  • hoe de gegevens worden beschermd in geval van technische problemen (of een verwijzing naar de garanties van de leverancier van de infrastructuur);
  • een eventuele langere minimumbewaartermijn dan de in artikel 3 voorgestelde tien jaar
  • welke maximale bewaartermijnen gelden;
  • toegankelijkheid en hergebruik van gegevensreeksen (waarbij voor elke gegevensreeks of elk onderzoeksproject wordt bepaald hoe, onder welke voorwaarden, wanneer en door wie de gegevens kunnen worden hergebruikt);
  • privacy van gevoelige gegevens (verwerking, opslag, toegang, beveiliging);
  • ondersteuning en opleiding van onderzoekers.

Het datamanagementplan voor elk onderzoeksproject is in overeenstemming met de afspraken die de onderzoeksinstelling heeft gemaakt.