Friese raadsvergaderingen krijgen ondertiteling
Voor de zomer moeten opnamen van Friese raadsvergaderingen van ondertiteling worden voorzien.
In de gemeenteraden in Friesland wordt Fries en Nederlands gesproken. Raadsleden schakelen regelmatig tussen de talen, soms zelfs binnen een spreekbeurt. Een beetje Fries draait er z’n hand niet voor om, maar voor spraakherkenningssoftware is al dat schakelen reuze ingewikkeld. In het kader van toegankelijkheid geldt sinds september 2020 een landelijke verplichting om opnames van raadsvergaderingen te ondertitelen. Voor het Fries werd een tijdelijke uitzondering gemaakt, maar binnenkort moeten Friese doven en slechthorenden ook in staat worden gesteld om opnamen van gemeenteraadsvergaderingen terug te kijken mét ondertiteling.
Achteraf toegevoegd
De eer valt als eerste te beurt aan negen Friese gemeenten: Tytsjerksteradiel, Achtkarspelen, Dantumadiel, De Fryske Marren, Heerenveen, Noardeast-Fryslân, Leeuwarden, Opsterland en Waadhoeke. Andere Friese gemeente, het waterschap en de provincie volgen op een later moment. De ondertiteling wordt achteraf aan de video-opnames van raadsvergadering toegevoegd. Een volgende stap, live ondertiteling, is technisch mogelijk, maar vraagt om meer data en rekenkracht om dezelfde accuratesse te realiseren, zegt Domenique van der Niet van Humain’r. Ook het vertalen van Fries naar Nederlands en andersom staat op het wensenlijstje voor de toekomst.
Vakjargon
Goede software om Friese spraak automatisch om te zetten naar tekst was nog niet beschikbaar. Eerder ontwikkelde de Fryske Akademy in een consortium met onder meer de Radboud Universiteit iets soortgelijks om het radio-archief van Omrop Fryslân te ontsluiten. Die software bleek echter niet zomaar geschikt om te gebruiken bij het ondertitelen van raadsvergaderingen. Daarvoor gebruiken raadsleden te veel vakjargon en afkortingen. De huidige AI-gebaseerde spraakherkenningssoftware is daarom doorontwikkeld gespecialiseerd op dit jargon door de Fryske Akademy, Radboud Universiteit en Humain’r, een softwareontwikkelaar met een sociale insteek.
Fries schrijven
Om de bestaande kunstmatige intelligentie te leren om het jargon van de Friese gemeenteraadsleden te verstaan, moesten vele uren aan extra audiomateriaal uit de gemeenteraden letterlijk worden uitgeschreven. Voor het transcriberen zet Humain’r mensen in met een afstand tot de arbeidsmarkt. In dit geval was het een uitdaging om genoeg mensen te vinden, want slechts achttien procent van de Friessprekenden kan goed Fries schrijven. Geschikte transcribenten kregen een speciale training in Fries schrijven voor kunstmatige intelligentie, zodat ze konden worden ingezet voor het project.
Wat moet de automatische ondertiteling maken van ‘uitnaaien’?
Vernederlandst
Het automatisch ondertitelen van gemeenteraadsvergaderingen waar zowel Fries als Nederlands wordt gesproken, levert de nodige uitdagingen op. ‘Het Fries en het Nederlands kruipen naar elkaar toe, met name in spreektaal,’ zegt Jelske Dijkstra, taalonderzoeker bij de Fryske Akademy. ‘Het komt vaak voor dat een Nederlands woord waarvoor nog geen Friese equivalent is, dan maar op z’n Fries wordt uitgesproken.’ Ook het omgekeerde is een bekend verschijnsel in de raadszalen. Wat moet de automatische ondertiteling bijvoorbeeld maken van ‘uitnaaien’? Grote kans dat het raadslid in kwestie bedoelt ‘er snel vandoor gaan’, oftewel útnaaien.
Doorontwikkeling
Daarnaast klinken er ook verschillende Friese dialecten in de raadszaal waar de software raad mee moet weten. En zoals bij alle raadsvergaderingen zijn er veel verschillende sprekers. Het is zaak om de AI te blijven doorontwikkelen. ‘Spraakherkenningssoftware moet je blijven onderhouden, want spraak verandert over tijd,’ zegt Van Der Niet. ‘Er komen nieuwe woorden bij, die soms opeens veel terugkomen in vergaderingen, zoals corona. En soms wisselt de bezetting in de raad en moet de software aan nieuwe stemmen wennen.’
Plaats als eerste een reactie
U moet ingelogd zijn om een reactie te kunnen plaatsen.