Datakwaliteit vormt de hoeksteen van effectieve besluitvorming en operationele efficiëntie in moderne organisaties. Het is niet langer voldoende om simpelweg over een grote hoeveelheid gegevens te beschikken. De kwaliteit van die gegevens is van essentieel belang. In dit artikel zullen we dieper ingaan op wat datakwaliteit is en hoe organisaties deze kunnen waarborgen
Er is al veel geschreven over datakwaliteit en wat dat nu precies is, maar over de essentie van datakwaliteit is er weinig meningsverschil in de literatuur. . In essentie gaat het om de vraag of de gegevens geschikt zijn voor het doel waarvoor ze worden gebruikt. Vaak wordt datakwaliteit gedefinieerd als iets verwijst naar de mate waarin gegevens nauwkeurig, consistent, betrouwbaar en relevant zijn voor het beoogde gebruik.
Datakwaliteit moet dus worden gedefinieerd aan de hand van het beoogde gebruik van de data. Een marketing manager zal bv. veel nadruk leggen op de volledigheid van emailadressen en zal als datakwaliteit requirement stellen dat emailadressen van klanten voor 98% volledig en accuraat zijn. Dit is nodig voor de marketingcampagnes van de organisatie. Een Finance Manager zal dit minder belangrijk vinden vanuit zijn functie en zal de lat lager leggen, bv. 90%. In dit voorbeeld wordt kwaliteit gemeten op twee dimensies, volledigheid (is het emailadres van alle klanten aanwezig) en accuraatheid ( is de emailadres ook echt van die persoon waarvan je het verwacht?).
Dit zijn slechts twee dimensies van vele. In de literatuur kan je vele lijsten vinden met overzicht van de dimensies. Maar hoe bepaal je nu op welke dimensies je voor jouw organisatie de datakwaliteit kunt meten?
Bij DIKW gebruiken we hiervoor de “Code for Information Quality 2019” van DAMA NL. DAMA NL is een non-profit vereniging van data professionals die zich inzet voor het bevorderen van datamanagement, en heeft een code opgesteld voor de datakwaliteit dimensies. Er zijn andere modellen die de dimensie definiëren maar wij (DIKW) vinden DAMA hierin de meest uitgebreide en werkbare.
DAMA heeft in de code een lijst van 60 dimensies en hun onderlinge samenhang beschreven. Tevens beschrijft DAMA in de code (hoofdstuk 3) een methode om de juiste kwaliteitsdimensie te selecteren. De methode stelt dat je die dimensie moet kiezen, die bijdraagt aan het behalen van een organisatiedoelstelling. In ons voorbeeld van accuraatheid van emailadressen: dit voorkomt reputatieschade voor de organisatie omdat je voorkomt dat je naar de verkeerde mensen mailt (met risico op datalekken).
Deze methode vinden we bij DIKW zeer krachtig, het koppelt namelijk de kwaliteitsverbetering van de data aan de organisatiedoelstellingen. Dat is uiteindelijk waar het om draait…..dat de data de bedrijfsdoelstellingen zo goed mogelijk ondersteunt.
DIKW Intelligence
Wattbaan 1
3439 ML Nieuwegein