Analyse des données

Les données jouent aujourd’hui un rôle central pour dégager une valeur scientifique, sociétal et économique dans de multiple domaines. Les installations massives d’entreprises dans le cadre de l’industrie 4.0 et du smart manufacturing, de la gestion des bâtiments, dans la santé, le transport et l’énergie génèrent des quantités gigantesques de données. Le réseaux sociaux tout public et professionnels permettent aussi de massivement partager et relier des données. Néanmoins, les données ne sont qu’une matière première, il est crucial de pouvoir les analyser pour les transformer en information à haute valeur ajoutée.

Chaque domaine d’application, dans la cadre de sa transformation numérique, vise à élaborer des modèles pour faciliter les décisions notamment, les jumeaux numérique (Industrie 4.0), les modèles d’information de bâtiment (BIM - Construction) et les modèles virtuels du fonctionnement physiologique humain (Santé). Les données capturées sur le terrain permettent de mieux aligner et individualiser les modèles mathématique théoriques générique. Les technologies et algorithmes d’analyse de données remontées du terrain depuis la fouille, le tri et les statistiques jusqu’à l’apprentissage automatique avancé sont disponibles mais leur utilisation à bon escient reste compliqué à systématiser et à mettre en oeuvre.

Le CETIC dispose d’une expertise conséquente en Machine Learning et Deep learning pour permettre à ses partenaires entreprises de tirer le meilleur parti de leur données dans le court terme ainsi que les plan d’amélioration à mettre en place pour raffiner la qualité des données collectées pour optimiser leur productivité par une meilleur pilotage de leurs installation et diminuer leur coût opérationnel via une maintenance prédictive.

Grâce à ses projets de recherche en cours et future, le CETIC met en oeuvre et continue à développer sa feuille en expérimentant, développant et améliorant l’application :
Des technologies de machine learning, de deep learning et d’exploiter des techniques de reinforcement learning pour permettre l’apprentissage en continue commençant sur des petits ensembles de données propres à des contextes très précis ;
Des technologies des moteurs de recommandations et de Chatbot sur du contenu en langues naturelles où l’internationalisation (multi-langues) et la localisation (contenu spécifiques à une utilisation précise d’une langue) doit être pris en compte ;
D’algorithmes d’apprentissage distribué afin de gérer les contextes où les données brutes ne peuvent être partagées (pour des raisons de vie privée ou autres) mais aussi pour permettre l’apprentissage sur des quantités énormes de données collectée de manière distribuées et devant être traitées rapidement tel que demandé par les futures flottes de véhicules autonomes ;
Des approches de meta-learning (learning to learn) afin de faciliter la mise en oeuvre de techniques d’intelligence artificielle (IA) de manière plus automatique et donc de permettre dans le futur l’utilisation de l’IA par des non-spécialistes du domaine.