Dit project zal een belangrijke bijdrage leveren aan de digitale infrastructuur die nodig is voor onderzoekers van Sociale Wetenschappen & Geesteswetenschappen om Nederlandse Gebarentaal (NGT) te onderzoeken, die vanaf 1 juli 2021 wettelijk erkend is als een van de officiële talen van het land, maar nog niet gedekt wordt door infrastructuurprojecten zoals CLARIAH.
Een van de belangrijkste problemen bij het bestuderen van gebarentalen is dat zij geen schrijfsysteem hebben. Primaire gegevens zijn in videoformaat en moeten momenteel handmatig worden getranscribeerd en geannoteerd. Om consistente annotaties te maken voor verschillende datasets moet annotatiesoftware (ELAN) worden gekoppeld aan een NGT-lexicon dat recht doet aan de morfologische, semantische en fonetische kenmerken van de taal. Woorden in NGT en Nederlands komen niet overeen in structuur of betekenis, waardoor het moeilijk is om lexicale bronnen voor het Nederlands op te bouwen.
Het project richt zich daarom op (i) een digitaal NGT lexicon met semantische en fonetische informatie, (ii) NGT corpora van volwassen taalgebruik en interacties tussen volwassenen en kinderen, en (iii) software voor machine-ondersteunde annotatie, met behulp van nieuwe AI-technologieën. Het verbindt deze gebarentaalbronnen met bestaande infrastructuren binnen CLARIAH, waardoor het CLARIN-K Centre for Atypical Communication Expertise (ACE) wordt verrijkt om instrumenten en middelen voor NGT te onderhouden en te bundelen.