Amélioration des méthodes de conduite de projets Big Data : retour d’expérience de pilotes industriels multi-sectoriels

Amélioration des méthodes de conduite de projets Big Data : retour d’expérience de pilotes industriels multi-sectoriels

Christophe Ponsard, Mounir Touzani and Annick Majchrowski, Stéphane Mouton, Amélioration des méthodes de conduite de projets Big Data : retour d’expérience de pilotes industriels multi-sectoriels, INFORSID 2017, 35e édition, Toulouse, 30 Mai - 2 Juin 2017.

Résumé. Afin de mener à bien leurs activités, les entreprises sont de plus en plus confrontées au défi de traiter des quantités croissantes de données provenant de dépôts numériques, d’applications d’entreprise, de réseaux de capteurs... Bien qu’un large éventail de solutions techniques soit disponible pour traiter ces données massives (Big Data), beaucoup d’entreprises peinent à les déployer en raison d’un manque de maturité lié à leur gestion. Cet article propose une guidance en la matière. Il s’ancre dans des méthodes documentées dans la littérature, trouvant leurs racines dans les projets de fouille de données. Nous avons également mené une série de pilotes Big Data dans différents domaines (IT, médical, sciences de la vie, spatial) qui nous ont permis de dégager un retour d’expérience et un guide pratique pour la conduite d’un projet Big Data. Ceci permet d’exploiter au mieux les méthodologies disponibles afin de traiter les problématiques relatives à la collecte des exigences, l’exploration et la préparation des nouvelles données, le phasage itératif de l’implantation de la solution et une montée en maturité.

Abstract. Nowadays, in order to successfully run their business, companies are facing the challenge to process ever increasing amounts of data generated from digital repositories, enterprise applications, sensors networks... Although a wide range of technical solutions are available to deal with such Big Data, many companies fail to deploy them actually because a lack of maturity in process and management challenges. This paper aims at providing guidance in those matter. We report about lessons learnt when deploying a series of Big Data pilots in different domains. We provide feedback and some practical guidelines on how to organise and manage a project based on available methodologies, covering topics like requirements gathering, data understanding, iterative project execution and raising the level of maturity.

Site web