Advertentie
digitaal / Nieuws

De razendsnelle opkomst van weglak-software

De vraag naar software waarmee persoonsgegevens in documenten kunnen worden weggelakt groeit in een ongekend tempo.

06 maart 2023
Tekst zwart gemaakt
Shutterstock

De vraag naar software waarmee persoonsgegevens in documenten kunnen worden weggelakt groeit in een ongekend tempo. Leveranciers voor de Nederlandse overheid spreken tegenover AG Connect van een bizarre vraag naar van anonimiseringssoftware. Er zijn echter ook uitdagingen.

Projectmanager 'Dossiers op Orde' pSG-cluster

JS Consultancy
Projectmanager 'Dossiers op Orde' pSG-cluster

Technisch Adviseur Waterveiligheid

JS Consultancy
Technisch Adviseur Waterveiligheid

Populair door wetgeving

Dat de vraag naar anonimiseringssoftware toeneemt is met name te danken aan recent ingevoerde wetgeving waaronder Algemene Verordening Gegevensbescherming (AVG) en Wet open overheid (WOO), waardoor de overheid verplicht is om overheidsinformatie openbaar te maken, terwijl er ook strikte regelgeving geldt voor het vrijgeven van persoonsgegevens. Voor een ambtenaar die een document openbaar maakt, betekent dat alle persoonsgegevens handmatig moeten worden weggelakt. Een flinke klus.

Bizarre groei

Gelukkig is er software waarmee veel werk uit handen kan worden genomen. Het Nederlandse bedrijf Octobox is één van de bekendere leveranciers. Het bedrijf focust zich volledig op de Nederlandse overheid, vertelt mede-eigenaar Harry Steenhuisen aan AG Connect. 'De AVG en de Woo bepalen tegenwoordig hoe de overheid zijn werk doet. Onze overheidsklanten willen uiteraard aan de regels voldoen, op technologisch en procesmatig vlak, maar ook qua beveiliging.'

De belangstelling voor anonimiseringssoftware neemt toe, ziet Steenhuisen. 'De groei is echt bizar. In twee jaar tijd is onze omzet drie keer zo groot geworden. Alle ministeries investeren erin. We zijn in een half jaar tijd bij meer dan zeventig overheidsorganisaties geïmplementeerd.' Maar ook buiten de overheid groeit de interesse. Met name vanuit de verzekeringswereld, waar de effecten van de AVG volgens Steenhuisen nu ook langzaam ‘doordruppelen’. Ook in de zorgwereld stijgt de behoefte aan onze software. 'Uiteindelijk zal het gehele bedrijfsleven ermee aan de slag moeten vanwege de wettelijke verplichtingen.'

Persoonsgegevens herkennen

Voor de software van Octobox werden algoritmen ontwikkeld die zelfstandig persoonsgegevens herkennen. De software scant documenten en herkent onder meer BSN-nummers, telefoonnummers, voornamen en achternamen. 'Het werkt met behulp van artificial intelligence. Alles wat een achternaam is in een document wordt weggestreept.' Maar hoe vind je een achternaam? 'Dat is inderdaad een uitdaging, want de algoritmes moeten binnen de context van een document kunnen werken.'

Taalwetenschap toepassen

De algoritmes worden getraind op het herkennen van persoonsgegevens. 'Je definieert bijvoorbeeld wat een achternaam is aan de hand van factoren. Daar wegen zaken mee als: heeft het woord een hoofdletter? Staat er meneer of mevrouw of de afkorting t.a.v. voor? Het systeem herkent ook grammatica. In een zin worden bijvoorbeeld werkwoorden en persoonlijk voornaamwoorden onderscheiden. Onze software gebruikt in feite taalwetenschap.'

Het is volgens Steenhuisen zaak dat de software dagelijks getraind wordt. 'Een 100% score vandaag betekent niet ook morgen 100%. De taal verandert, het is een organisch geheel. Onze software is dus geen applicatie, maar ook organische software die zich aanpast aan wat er in de wereld gebeurt.'

Europese wetgeving

De software van Octobox zal echter nooit 100% af zijn, zegt Steenhuisen. 'Taal verandert iedere dag en de systemen moeten daarin in meebewegen. Er moet daarom altijd een mens in controle zijn om alles 100% correct geanonimiseerd te krijgen.' Bovendien is er nieuwe wetgeving op komst waarbij de werking van algoritmes moet kunnen worden verantwoord aan burgers. De Europese Commissie publiceerde onlangs het concept van de Europese verordening op de artificiële intelligentie (AI). 

Uitlegbare algoritmes 

De nieuwe regels gaan een uitdaging vormen voor iedere leverancier van anonimiseringssoftware. 'Wanneer gegevens worden weggelakt moet dat kunnen worden uitgelegd. Iets wat bijvoorbeeld de Belastingdienst tijdens de toeslagenaffaire niet lukte toen er enorme problemen werden blootgelegd. Een ambtenaar moet altijd kunnen uitleggen waarom de software de keuze heeft gemaakt en deze keuze kunnen verantwoorden.' Een zeer belangrijke ontwikkeling volgens Steenhuisen. Leveranciers zullen bereid moeten zijn om transparantie te kunnen bieden.

Die verantwoording is op dit moment nog niet ingebouwd in software. 'Octobox werkt hieraan in samenwerking met de rijksoverheid. 'Je moet met de ‘binnenkant’ van software aan de slag en tools eromheen bouwen waarmee je op een handige manier kunt uitleggen waarom besluiten zijn genomen zoals ze zijn genomen,' vertel Steenhuisen.

Videobellen

Hij ziet nog een belangrijke ontwikkeling met de komst van de Wet open overheid: er wordt binnen de overheid steeds vaker vergaderd via videobellen. Tijdens de corona-uitbraak kreeg dit een vlucht. 'Documenten en gegevens verdwijnen en maken plaats voor video- of geluidsopnames. Maar ook deze gesprekken zul je moeten archiveren. En ook daar horen privacymaatregelen bij. Op papier kun je gegevens weglakken, bij video’s zul je bijvoorbeeld gezichten moeten blurren.'

Dit artikel verscheen eerder op AG Connect. 

Reacties: 1

U moet ingelogd zijn om een reactie te kunnen plaatsen.

Nico Bos
Zijn er nog meer bedrijven die dit soort software produceren of is OCTOBOX de enige? (b.v. CARP-E, Datadash, DataMask, Docspro, MultyScan, DATPROF, DocuWork, Klippa, Scconcept, ScanPBL, CoFOrce, Zylab, TM7 etc. etc.)
Advertentie