Several books stacked on top of each other
Several books stacked on top of each other

Automatische analyse van de concreetheid van teksten

Tijdsduur
1 januari 2023 tot 31 augustus 2023
Projecttype
Onderzoek

In 2021 en 2022 ontvingen we een kleine onderzoekssubsidie om een tool te ontwikkelen voor de automatische analyse van concreetheid in teksten. Daartoe hebben we, naast de bestaande concreetheidslijst van Brysbaert et al. (2014), een substantieel aantal woorden (ca. 2000) laten beoordelen op concreetheid en specificiteit. Dit laatste was een aanvulling op een langer lopend project (Spooren et al., 2015), en is met name voor leugendetectieonderzoek nuttig gebleken. In 2022 hebben we gewerkt aan een uitbreiding van het vorige systeem. De interface (beschikbaar via cesar.science.ru.nl > Tools > TABLET) maakt het nu mogelijk om verschillende concreetheidsscores voor homoniemen te selecteren, afhankelijk van de betekenis in de context, niet-scheidbare meerwoordsuitdrukkingen zijn adequaat geregeld en de handleiding is geoptimaliseerd.

In 2023 moeten nog vier zaken worden geoptimaliseerd: (i) de implementatie van concretenesscores voor tijd- en positiebepalingen; (ii) de implementatie van concretenesscores voor scheidbaar samengestelde meerwoordsuitdrukkingen; (iii) de volgorde waarin de submodules van TABLET worden aangeroepen moet worden geoptimaliseerd; (iv) de faciliteit om als onderzoeker concretenesscores toe te voegen/te wijzigen moet worden geïmplementeerd.

We zullen ook een interface (bijv. in de vorm van een app) laten ontwikkelen die TABLET gebruikt om gebruikers een indicatie te geven van de concreetheid van hun tekst (waarbij bijvoorbeeld abstracte woorden, zinnen of alinea's rood worden gemarkeerd en concrete in groen).

Contactinformatie