sociaal / Partnerbijdrage

Datageletterdheid – Verdieping: Datakwaliteit

Datageletterdheid centraal in proces van datagedreven werken. Verdieping: Datakwaliteit.

21 september 2021

In deze reeks artikelen neem ik je mee hoe datageletterdheid centraal staat in het proces van datagedreven werken. Elke paar weken post ik een artikel en daarin komt stap voor stap het belang van datageletterdheid binnen datagedreven werken aan bod. Vandaag gaan we dieper in op: datakwaliteit.

In het artikel “stap 2: betrouwbare data” heb ik het onderwerp datakwaliteit ook besproken, lees hier

We stonden hier stil bij dataregistratie en hoe datakwaliteit een onderdeel is binnen het proces van dataregistratie. In het artikel van vandaag gaan we dieper in op datakwaliteit in relatie tot het eindresultaat, de output, en hoe jij als eindgebruiker zelf de datakwaliteit kunt toetsen bijvoorbeeld door middel van een grafiek, tabel, rapportage of dashboard.

 

Definitie datakwaliteit 

Wat is een gangbare definitie van datakwaliteit? Gebruik je vanuit de business, bijvoorbeeld als beleidsmedewerker, dezelfde definitie als bijvoorbeeld een applicatiebeheerder vanuit de afdeling informatievoorziening?

 

Datakwaliteit is een samengesteld woord uit de worden ‘data’ en ‘kwaliteit’.

  

Data= dit zijn feitelijkheden. De welbekende 1’tjes en 0’tjes. Denk aan cijfers in Microsoft Excel, maar ook aan onderzoekrapportages, de krant, social media en alles wat je smartphone vandaag de dag registreert. Data vloeit voort uit activiteiten binnen een proces. 

Kwaliteitde technische eigenschappen van een stof en geschiktheid voor een bepaald gebruik aan te duiden en de mate van voldoening aan een vastgestelde norm. 

 

Vrij technisch allemaal nog. Als je deze twee combineert krijg je ‘datakwaliteit’ en een praktische definitie voor de business zou bijvoorbeeld kunnen zijn: een middel om te bepalen of jij in jouw positie wel of niet iets kunt met de data. En zo ja, in welke mate dan. Technisch gezien, of vanuit de bril van een data-analist, applicatiebeheerder of informatieanalist, wordt anders naar de definitie. Dit gebeurt aan de hand van enkele technische criteria. Deze zes gangbare criteria binnen informatiemanagement zijn: 

 

  • Accuraat: is de data punctueel, zonder fouten en interrupties?  
  • Volledig: is de data allemaal aanwezig, juist ingevuld? 
  • Type/formaat: wordt alle data volgens dezelfde manier geregistreerd? Denk aan geboortedata (22/01/1980 of jan/22/’80).
  • Consistentie: wordt (bijv. vanuit verschillende bronnen) de data op dezelfde manier opgesteld? 
  • Dubbelingen: zijn alle records uniek of staat data er dubbel in? 
  • Integriteit: is elke record volledig herkenbaar inclusief alle onderdelen van de data of ontbreken er bijvoorbeeld van een klant of zorgaanbieder er onderdelen waardoor je de data niet kunt koppelen aan andere data. Bijvoorbeeld categorieën of subonderdelen.

 

Elke keer als je vanuit de business een tabel of een grafiek bekijkt, ga je natuurlijk niet al deze criteria langs om de datakwaliteit te toetsen. We maken dus onderscheid tussen technische (vanuit informatievoorziening) datakwaliteit en praktische (vanuit de business) datakwaliteit. 

 

Hoe kan ik vanuit de business dan wel naar een tabel of grafiek kijken? 

Het zou fijn zijn als er vanuit de techniek reeds de eerder genoemde criteria zijn verwerkt in de totstandkoming van de tabel of grafiek. Als je bijvoorbeeld met je muis over de tabel of grafiek heen gaat dat er achterliggende informatie getoond wordt over de criteria. Daarmee wordt de technische datakwaliteit in ieder geval alvast bevestigd en kun jij je als eindgebruiker focussen op de datakwaliteit vanuit jouw positie. Waar ‘moet’ jij dan nog op letten? Stel jezelf (enkele van) de volgende vragen: 

 

  • Welke data had ik verwacht en komt dit in de buurt bij wat ik nu zie? 
  • Uit welke bronnen is deze data ontsloten? 
  • Welke berekeningen liggen hier eventueel onder? 
  • Hoe ziet het primaire proces van dataregistratie eruit? 
  • Welke collega’s of partners hebben zich gemoeid met deze data? 
  • Wie heeft deze grafiek of tabel gebouwd? 
  • Over welke periode of tijdslijn gaat deze data? 
  • Wat zegt mijn interpretatiegevoel over deze data? 
  • Herken ik deze cijfers als ik vanuit mijn domeinkennis hier naar kijk? 
  • Klopt dit wel?!

 

Je hoeft natuurlijk niet op alle vragen een compleet antwoord op te hoesten of in elke situatie deze vragen toe te passen. Voornamelijk bij nieuwe data, eerste publicaties en vernieuwde rapportages of dashboards doe je er wijs aan om uitgebreider deze praktische toetsen toe te passen. Naar mate je dezelfde data over nieuwe periodes en ververste indicatoren krijgt, zul je minder tijd te hoeven besteden aan deze praktische toetsen. Er helemaal niet meer bij stil staan is nou ook niet de bedoeling…  

 

Het toetsen en bepalen van de datakwaliteit is een samenspel van techniek en praktijk, een samenwerking tussen de applicatiebeheerder dan wel analist en de inhoudelijke collega dan wel beleidsmedewerker. 

 

Ik kan me voorstellen dat je na dit artikel nog met enkele vragen zit zoals: 

 

  • Wat als de technische datakwaliteit-check niet reeds is uitgevoerd? Of als jij als eindgebruiker dit niet zelf kunt toetsen/checken? 
  • Hoe ga je de technische criteria van datakwaliteit in de praktijk brengen?  
  • Hoe maak je deze onderdeel van de informatievoorzieningsprocessen?  
  • Hoe bevorder je de datageletterdheid bij de business om de datakwaliteit te kunnen toetsen? 
  • Hoe zorg je er voor dat de business en de IT het besef krijgen van elkaars taal, inzicht en behoeften en pro actief met elkaar constructief het gesprek aan gaan?

 

Al deze vragen komen aan bod in de Datadonderdag waarin we je gratis meenemen in enerzijds de basisbeginselen van data, datageletterdheid en datagedreven werken, anderzijds staan we stil bij het onderwerp van de maand: datakwaliteit. Meld je hier gratis aan: Datadonderdag 30 september

 

Meer weten?

Wil je meer weten over datageletterdheid en datagedreven werken? Of ben je benieuwd naar alle stappen binnen het proces van datagedreven werken? Download dan de gratis whitepaper ‘Datageletterdheid & Datagedreven werken: voor niet technische mensen’.  

 

Wil je meteen al aan de slag om je eigen datageletterdheid en je kennis over datagedreven werken te vergroten? Vraag dan een gratis demo aan van onze E-learning datageletterdheid & datagedreven werken: de basis.

 

Wil je contact met mij om even te sparren over datageletterdheid of datagedreven werken? Bel me gerust op 085- 112 4371 of stuur me een mail via peterfrans@vandamoosterbaan.nl.

Plaats als eerste een reactie

U moet ingelogd zijn om een reactie te kunnen plaatsen.