Data Management

Les services applicatifs Internet et mobiles ont engendré une explosion de quantité de données collectées et transmises. La multiplication des objets connectés décuple encore ce phénomène. Les entreprises assistent également à une croissance très importante des données qu’elles génèrent du fait de l’installation massive, dans le cadre de l’industrie 4.0 et du smart manufacturing, de capteurs capables de transmettre l’ensemble des données qu’ils génèrent.
Cependant, peu d’entreprises ont une vision claire de la valeur qu’elles pourraient retirer des données collectées. De plus, les expertises requises pour gérer les données afin de faciliter la prise de décisions se trouvent rarement au sein d’une seule entreprise, a fortiori d’une PME.
Le terme “Big Data” regroupe un ensemble de problématiques connues sous le nom des “5 V”: Volume, Variété, Vélocité, Véracité et Valeur. Les données considérées ont un volume tel qu’il est impossible de les stocker et de les traiter dans un dépôt centralisé. La variété fait référence au fait que les sources de données à exploiter sont gérées par différents acteurs et peuvent générer des données de nature très différente. Il est donc impossible d’harmonisation les schémas, les formats, ou les technologies utilisées. Cette variété induit une complexité qui doit être prise en compte. La vélocité avec laquelle les données doivent être traitées peut varier fortement d’une application à l’autre. Les technologies à mettre en œuvre, les techniques de réplication et de synchronisation de données devront être choisies en fonction de cette caractéristique des données à traiter. La véracité fait référence à la qualité des données. En plus de sa précision, une source de données doit exposer explicitement d’autres propriétés des données qu’elle génère. Un programme informatique pourra ainsi filtrer automatiquement les sources de données qui satisfont les propriétés requises dans un contexte donné. Il est ainsi possible d’éviter les coûts liés à l’exploitation de sources inutilement précises ou d’écarter les sources dont l’intégrité ou l’exactitude sont compromises. Cette problématique du coût et, plus généralement, des attentes des entreprises par rapport aux données et leurs traitements se résume dans la valeur. Cette dimension cruciale exige qu’une entreprise se questionne sur ses initiatives Big Data. En respectant une méthodologie de gestion de projets appropriée aux autres problématiques du Big Data, la gestion des données s’inscrira dans un cadre de plus en plus précis afin d’extraire une valeur croissante des données.