Nieuwsberichten over de pandemie bieden een enorm rijke dataset voor communicatieonderzoek: Hoe werd over de pandemie gecommuniceerd? Hoe veranderde die communicatie in de loop der tijd? En wat kunnen we, nu de pandemie ten einde lijkt te lopen, leren over publieke communicatie over ziekte en gezondheid?
De afgelopen twee jaar hebben we een onderzoekslijn kunnen opbouwen waarin het gebruik van metaforen in de Covid-communicatie centraal staat. Zo hebben we een groot corpus aangelegd van alle Covid-gerelateerde artikelen in Nederlandse kranten. Ook hebben we met behulp van machine learning een tool ontwikkeld en geoptimaliseerd die automatisch metaforen in het corpus kan identificeren. Deze tool presteert nu even goed als, of zelfs iets beter dan, de state of the art op het gebied van automatische metafooridentificatie - mede omdat we bij het optimaliseren van de tool gebruik konden maken van aanvullende handmatige correcties/aanvullingen op de automatische codering.
Ons instrument voor metafooridentificatie presteert nu op een zodanig niveau dat we het breder beschikbaar kunnen stellen. Zo dragen we bij aan de FAIR-principes voor open science en kunnen ook andere onderzoekers ons corpus en onze tools gebruiken. Dit vereist het opzetten van een online omgeving waarin het corpus toegankelijk wordt gemaakt en waarin de tools worden geïntegreerd. Daarnaast moeten gebruiksvriendelijke handleidingen beschikbaar worden gesteld zodat onderzoekers zelfstandig met de data kunnen werken.
Naast het beschikbaar maken van het corpus en de tools willen we ook de volgende stap zetten in het verkennen en optimaliseren van automatische bron- en doeldomeinidentificatie.