Ingénierie et science des données

Les quantités de données produites par les applications existantes, sur le web ou dans nos systèmes d’informations, sont parfois trop importantes pour être traitées efficacement. De nouvelles applications (senseurs, caméras, bio-informatique, business intelligence, web 2.0, etc.) génèrent des volumes d’information encore plus importants. Ces données s’avèrent, de plus, difficiles à structurer et exploiter efficacement avec les techniques usuelles.

De nouvelles méthodes et de nouvelles technologies, telles les bases de données NoSQL (Not only SQL), ou le framework Spark, émergent pour gérer et exploiter au mieux ces énormes volumes de données.

La promesse du Big Data est la possibilité de gérer toutes les données à disposition des entreprises au moyen d’une infrastructure de gestion des données scalable et évolutive. Cette infrastructure permet la gestion des trois Vs : le volume de données à gérer, la vitesse de traitement des données, et la variété (hétérogénéité) des formats de données qui doivent être pris en compte.

Le CETIC expérimente les technologies du Big Data, afin de déployer des cas d’utilisation pertinents :

  • Acquisition de données
  • Gestion de la variété (structuration de données non structurées)
  • Stockage de données (NoSQL)
  • Traitement des données (Spark)
  • Enrichissement de données (analyse sémantique, indexation, moteurs de recherche)
  • Visualisation des données

Grâce à ses projets de recherche internationaux et régionaux dans le domaine Industrie 4.0 et de la Santé tels que Ponte, I2MSteel, Grinding 4.0, BigData@MA, Quality 4.0, NewTech4Steel, P15Insight, Artemtec, le CETIC améliore continuellement son expertise et ses compétences technologiques dans le domain de l’ingestion (ETL - Extract Transfer Load) pour ensuite les proposer et les transférer aux entreprises wallonnes notamment en réalisant des prototypes. Dans ce cadre, le CETIC développe d’ailleurs le framework open source FADI.