Bannière ORACLE
Qualité des données

Qualité des données

La démarche Qualité des données

L’objectif premier d’ORACLE est de mettre à la disposition des scientifiques et des opérationnels l’ensemble des données de base recueillies sur la totalité de la période d’observation. Ces données exigent la mise en place d’une procédure qualité. Ce travail s’inscrit dans la politique qualité d’INRAE, mise en place sur l’ensemble de ses sites d’Observation, et s’appuie sur deux réseaux, « Mesure et Instrumentation » et « Base de données ». La démarche qualité comporte trois étapes essentielles.

1- Maintenance et métrologie des équipements d’ORACLE :

L’aspect métrologique avec l’établissement de protocoles rigoureux d’installation des appareils, la systématisation des procédures d’utilisation et la maintenance rigoureuse et régulière constitue la première étape de notre démarche qualité.

Nous avons mis en place une base de données concernant l’ensemble du parc métrologique d’ORACLE avec la mise en place d’un logiciel de maintenance d’équipement de mesure (SPLIT4®). Les données techniques de chaque appareil, leur localisation précise sur ORACLE, la date de chaque étalonnage et des événements de maintenance sont pris en compte par le logiciel. Ceci nous permet une meilleure traçabilité des équipements et de leur maintenance, une maîtrise des non-conformités et une amélioration des performances des moyens de mesure.

2- Traitement des données

L’étape du traitement des données comporte le rapatriement fréquent de la donnée, la vérification de la cohérence de la série, ainsi que la vérification de la cohérence des variables et des paramètres les uns par rapport aux autres. Cette étape est d’autant plus importante qu’elle doit permettre la validation rapide des 34 000 données mensuelles d’Oracle.

  1. Le rapatriement des données
    Les données pluviométriques sont télétransmises directement sur une base de données interne, de manière automatisée, au pas de temps d’une heure.
     Les données limnimétriques sont rapatriées après validation sur la banque HYDRO gérée par le MEEDDAT.
    L’ensemble des autres données sont rapatriées à fréquence régulière sur des bases de données internes (tous les deux mois en moyenne).
  2. 2. La validation des données
    Les données ainsi rapatriées sont validées par l’Ingénieur de recherche, gestionnaire de l’Observatoire. Des routines de validation semi-automatisées ont été mises en place pour permettre une validation plus rapide, mais aussi une certaine répétabilité de la validation.

L’utilisation des outils statistiques (e.g., moyenne, quartiles…) permet :

  • d’effectuer une inter-comparaison sur l’ensemble de la série de données sur toute la période d’Observation
  • de vérifier la cohérence de la série, des variables et des paramètres les uns par rapport aux autres.

3- Reconstitution des données :

L’objectif est de mettre en œuvre un certain nombre de dispositions au niveau de la gestion et au niveau technique pour aboutir à des résultats fiables et être en mesure de prouver cette fiabilité (notion de confiance). Ce travail s’appuie notamment sur des recommandations pour la qualité en recherche, tel que le document AFNOR, FDX50-551.
Les outils et méthodes de validation, mais également la reconstitution des données, s’appuient sur l’expérience et l’expertise du INRAE, développée depuis près de 50 ans sur la gestion des données. Dans chaque fichier validé sont étiquetées les données validées et les données reconstituées.