La qualité des données et le contrôle inhérent sont des sujets critiques dans les organisations.
Pour chaque activité liée aux données, comme les modélisations / reportings / calculs, les départements concernés ainsi que leurs prestataires définissent au départ le niveau de qualité de données suffisant pour leur production.
À titre d’exemple, on pourrait définir d’avoir 5 % des valeurs absentes ou plafonner la valeur maximale…
Si les données ne sont pas conformes avec les critères définis il existe des alternatives.
Dans certaines entreprises, le processus est de consigner dans un tableau Excel les données qui ne correspondent pas aux critères ou qui sont considérées comme des doublons et de les supprimer.
La plateforme Orkestra adresse directement les enjeux autour de la définition et du contrôle de la qualité des données autour de plusieurs principes.
Principes du contrôle de qualité
Orkestra propose par exemple des systèmes d’indicateurs comme les feux (vert, orange ou rouge) qui signalent si des contrôles sont bloquants ou non, et qui déterminent si la production doit être validée ou pas. Ces contrôles sont effectués sur la base des critères listés par le client.
Le système des feux est particulièrement efficace. Le « feu vert » signifie que les données sont testées et sont bonnes. Le « feu orange » signifie qu’on remonte au client une anomalie mais qui n’est pas bloquante. Et le « feu rouge » montre qu’il y a un contrôle bloquant.
Orkestra informe ainsi l’utilisateur qu’il y a des problèmes avec les données en précisant le niveau de gravité. Le responsable de la production peut décider de la diffusion ou non du jeu de production.
Dans les deux cas Orkestra met à disposition le fichier Excel avec la liste de toutes les non-conformités à corriger. Ainsi Orkestra identifie les problèmes des données et propose tout de suite la liste des valeurs à corriger. Avec ce contrôle, on peut avancer sur le nettoyage de données selon les priorités des projets.
Entre le marteau et l’enclume : qualité de données
ou qualité de KPIs ?
Si le client n’est pas en mesure de corriger les données, il y a toujours l’option radicale d’alléger les critères de qualité ou de faire sortir du périmètre de calcul les données erronées (ce qui pourrait déformer les résultats et être risqué pour l’entreprise…).