De Radboud Open Science Inspirators zijn personen die zich op wat voor manier dan ook actief met Open Science bezighouden. Zij vertellen in deze rubriek - die onderdeel is van het Radboud Open Science Programma - over hun betrokkenheid bij Open Science en de uitdagingen en voordelen die daarmee gepaard gaan. Elke Radboud Open Science Inspirator komt met een tip voor collega’s die ook met Open Science aan de slag willen. Deze keer: Anas Maya, data steward bij de Faculteit der Letteren.
Radboud Open Science Inspirator: Anas Maya
‘Het beoefenen van Open Science vereist dat er veel tijd en moeite wordt gestoken in het maken van een herbruikbare dataset. Voor mij begint het allemaal met één belangrijke vraag: Kunnen mijn gegevens ook waardevol zijn voor anderen? Als het antwoord ja is, dan kan ik ze beter niet voor mezelf houden - dan moet ik die data bruikbaar maken voor anderen. Dit kan een uitdaging zijn omdat ik me moet kunnen voorstellen hoe andere wetenschappers, die ik niet ken, mijn gegevens zouden kunnen hergebruiken.
Succesvol hergebruik van gegevens vereist dat ze beschreven en gestructureerd zijn op een manier die ze begrijpelijk maakt voor anderen, en die samenvoegen van soortgelijke datasets mogelijk maakt. Stel je voor dat onderzoeksteams in verschillende landen aan hetzelfde type diabetes werken en elk hun eigen terminologie en taal gebruiken. Je zou meertalig moeten zijn en op de hoogte van beslissingen van alle teams om concepten op elkaar te kunnen afstemmen. Daarom moeten datasets worden gevuld met gestandaardiseerde terminologie. Zonder die standaardisatie zijn gegevens zelden echt vindbaar, toegankelijk, interoperabel en herbruikbaar (FAIR).
'Voor mij begint het allemaal met één belangrijke vraag: Kunnen mijn gegevens ook waardevol zijn voor anderen?'
Naast mijn rol als data steward bij de Faculteit der Letteren, maak ik ook deel uit van het Radboud Healthy Data Programma - een gezamenlijk programma van de universiteit en het Radboud universitair medisch centrum. Het doel is om een digitale infrastructuur te ontwikkelen die (gezondheids)onderzoeksgegevens verbindt met AI-expertise op de campus. Om een idee te krijgen van hoe het delen van data op de campus gaat, hebben we een enquête gehouden onder onderzoekers van de Radboud Universiteit en het medisch centrum. In totaal hebben 518 onderzoekers de enquête ingevuld. Een van de bevindingen: veel onderzoekers worstelen met het idee van gecontroleerde terminologie. Meer dan de helft van de respondenten wist zelfs niet precies wat het betekende. In de natuur- en levenswetenschappen is een dergelijke standaardisatie al redelijk ingeburgerd. In de sociale en menswetenschappen groeit het bewustzijn, maar documentatie is nog vaak ad hoc en vooral gericht op menselijke interpretatie, in tegenstelling tot machines. Er is dus nog veel werk aan de winkel.
Een ander belangrijk aspect om gegevens echt deelbaar te maken is documentatie. Veel onderzoekers denken tijdens hun project dat ze alles zullen onthouden of dat alle documenten voor zichzelf spreken, maar dat is verre van waar. Denk aan vaag benoemde bestanden op je computer - een paar maanden later weet zelfs jij niet meer wat ze zijn. De belangrijkste stap? Begin hier in een vroeg stadium over na te denken.
Ja, documenteren kost tijd en het gebruik van gestandaardiseerd vocabulaire is niet altijd eenvoudig. Maar de beloning is aanzienlijk: goed gestructureerde data is makkelijker te begrijpen en te hergebruiken - ook voor AI-toepassingen - maakt samenwerking mogelijk, versnelt onderzoek en vergroot de algehele impact van je werk.
Anas' Open Science Tip
Zie je dataset niet als een ondeelbare entiteit. Het is niet alles of niets - je hoeft niet al je gegevens precies zo te publiceren als ze zijn verzameld. In plaats van gegevens van 100 deelnemers te delen, kun je bijvoorbeeld gegevens van slechts 50 deelnemers delen. Of in plaats van ruwe audio-opnames, kun je alleen de transcripties publiceren. Je kunt gegevens ook anonimiseren, pseudonimiseren of versleutelen. Je kunt flexibel zijn in de manier waarop je gegevens wilt delen.
Contactinformatie
- Organisatieonderdeel
- Faculteit der Letteren