L’intelligence artificielle transforme des secteurs entiers, du médical à la défense, mais une question centrale reste entière : comment entraîner des modèles tout en garantissant la confidentialité des données sensibles ? Une réponse prometteuse réside dans la combinaison de trois technologies complémentaires : l’apprentissage fédéré (Federated Learning), le chiffrement homomorphe (Homomorphic Encryption) et la distillation de connaissances.
L’apprentissage fédéré permet à plusieurs institutions — hôpitaux, ministères, entreprises — de collaborer pour construire un modèle commun, sans jamais partager leurs données brutes. Chaque entité entraîne un modèle localement, puis envoie uniquement les paramètres appris à un serveur central pour agrégation. Ce paradigme est particulièrement adapté aux environnements sensibles où la protection des données est cruciale.
Bien sûr, cela dépasse largement le domaine de la santé. Dans le secteur de la défense, par exemple, les données sont souvent classifiées et inaccessibles aux partenaires extérieurs. L’apprentissage fédéré permet alors de bénéficier de l’intelligence collective tout en maintenant des cloisonnements stricts entre les sources de données. Une logique similaire s’applique aussi à des domaines comme la finance, la justice ou la recherche industrielle.
Mais ce modèle distribué n’est pas sans vulnérabilités : attaques par inférence, empoisonnement, ou fuite d’informations via les modèles eux-mêmes. D’où la nécessité d’ajouter des couches de protection avancées.
Le chiffrement homomorphe permet d’effectuer des calculs directement sur des données chiffrées, sans jamais devoir les déchiffrer. Appliqué à l’apprentissage fédéré, cela signifie que les poids des modèles peuvent être chiffrés avant d’être transmis, puis agrégés en toute sécurité.
Mais cette sécurité accrue à un prix : les opérations homomorphes sont coûteuses en calcul et en mémoire, surtout pour les modèles de grande taille. Il devient alors crucial de concevoir des modèles plus légers, sans sacrifier leur performance.
Deux techniques principales sont utilisées pour compresser les modèles :
Toutes les méthodes de distillation ne se valent pas. Dans notre approche, nous combinons deux formes complémentaires :
Nous avons appliqué cette approche innovante à la détection du cancer du sein à partir de mammographies, avec une architecture fondée sur trois piliers :
Vous souhaitez en savoir plus sur cette approche innovante ? N’hésitez pas à contacter nos experts.