HPC4U

HPC4U

Highly Predictable Clusters for Intranet Grids

Expertises:

Ingénierie des systèmes IT complexes 

Fiche projet:

Description 

HPC4U (Highly Predictable Clusters for Intranet Grids, en français, des Clusters de Haute Disponibilité pour des Grids Intranet), doit permettre à terme la résolution de problèmes rencontrés dans les clusters, tels que l’engagement et la qualité de service. Pour mémoire, les Grids Intranet sont constitués par un ensemble d’ordinateurs puissants, reliés à l’intérieur d’un réseau Intranet. Le maillage permet de développer des puissances de calcul très importantes. Aujourd’hui, de plus en plus de clusters sont réalisés dans le cadre de grandes entreprises ou de centres de recherche qui nécessitent une puissance de calcul élevé. HPC4U développe un middleware capable d’opérer sur le Grid et offrant à l’utilisateur des niveaux de qualité de service (via SLA) pour les travaux de calcul qu’il soumet en fonction de leur criticité. HPC4U, pour garantir les SLA négociés, utilise des mécanismes de tolérance aux pannes à différents niveaux (processus, mémoire, stockage et réseau). Le CETIC a deux grandes responsabilités sur le projet. D’une part, il est Dissemination Manager, et doit donc assurer un maximum de visibilité au projet sur la scène européenne et internationale. Ce faisant, le CETIC a pu créer de nouveaux partenariats et contacts scientifiques et industriels. D’autre part, le CETIC a en charge tous les aspects qualité et tests du projet. Cela permet de mettre en œuvre et d’adapter les différentes techniques qualité développées par ses équipes (mesure de code, assurance qualité, élaboration de plans qualité) dans un domaine technologique de pointe. L’autre avantage majeur réside dans le développement d’une expertise dans le test de systèmes complexes et distribués comme HPC4U. Cette expertise très recherchée actuellement, étant donné l’orientation prise par le secteur IT, est mise à profit dans le cadre des collaborations avec les entreprises wallonnes du secteur IT. En terme de délivrables, le CETIC a produit les spécifications (exigences) du système, le plan qualité du projet ainsi que les deux premiers rapports de vérification et validation.

Résultats 

Sur base de la première version développée en 2005 et offrant les mécanismes de tolérance aux pannes pour des applications non parallélisées, le consortium s’est concentré en 2006 sur le développement de la version pour applications parallélisées avec possibilité de migration dans un même intranet.HPC4U a publié fin 2006 une version open-source de démonstration de la plate-forme permettant aux utilisateurs potentiels de tester les fonctionnalités de tolérance aux pannes offertes par le système. Sur le plan du développement de la version mixte (open-source et composants commerciaux), HPC4U finalise les tests de la version permettant d’offrir les mécanismes de tolérance aux pannes pour des applications parallélisées. Le consortium entame la réalisation de la dernière phase consistant à offrir ces fonctionnalités de tolérance aux pannes sur le Grid.