Infrastructures Big Data

Le Big Data ou « stockage et analyse des données à grande échelle » est un sujet actuel qui met la donnée au centre de la stratégie d’entreprise.

Les quantités de données produites par les applications existantes, sur le web ou dans nos systèmes d’informations, sont parfois trop importantes pour être traitées efficacement. De nouvelles applications (senseurs, bio-informatique, business intelligence, web 2.0, etc.) génèrent des volumes d’information encore plus importants. Ces données s’avèrent, de plus, difficiles à structurer et exploiter efficacement avec les techniques usuelles.

De nouvelles méthodes et de nouvelles technologies, telles les bases de données NoSQL (Not only SQL), ou le framework Hadoop, émergent pour gérer et exploiter au mieux ces gros volumes de données.

La promesse de Big Data est la possibilité de gérer toutes les données à disposition des entreprises au moyen d’une infrastructure de gestion des données scalable et évolutive. Cette infrastructure permet la gestion des trois Vs : le volume de données à gérer, la vitesse de traitement des données, et la variété (hétérogénéité) des formats de données qui doivent être pris en compte.

Le CETIC expérimente les technologies du Big Data, afin de déployer des cas d’utilisation pertinents :

  • Acquisition de données
  • Gestion de la variété (structuration de données non structurées)
  • Stockage de données (NoSQL)
  • Traitement des données (Hadoop)
  • Enrichissement de données (analyse sémantique, indexation, moteurs de recherche)
  • Visualisation des données

Le CETIC contribue à la recherche dans ce domaine et effectue une veille technologique constante. Il participe à l’élaboration et la réalisation de prototypes avec des partenaires industriels.