Stockage de données pour le calcul haute performance : la fin des goulets d'étranglement à MINES ParisTech

Une grande école d'ingénieurs française mène des recherches de pointe dans l'industrie grâce à l'ActiveStor de Panasas

  • Stockage de données pour le calcul haute performance : la fin des goulets d'étranglement à MINES ParisTech
    Stockage de données pour le calcul haute performance : la fin des goulets d'étranglement à MINES ParisTech
  • Stockage de données pour le calcul haute performance : la fin des goulets d'étranglement à MINES ParisTech
    Stockage de données pour le calcul haute performance : la fin des goulets d'étranglement à MINES ParisTech

« Grâce à l’ActiveStor de Panasas, les chercheurs gagnent du temps puisqu'ils n'ont plus à déplacer ni à copier les fichiers de données avant de pouvoir les traiter. Ils gagnent en productivité puisqu'il n'y a plus de goulets d'étranglement au niveau du calcul hautes performances pour accéder au système de stockage. La bande passante est quatre à cinq fois plus élevée qu'auparavant. Et le partage de fichiers est plus pratique, grâce à des temps de réponse plus courts et à un débit plus élevé. » explique Gregory Sainte-Luce, Responsable Informatique du Centre de recherche sur les matériaux et membre de la Direction Informatique de MINES ParisTech.
MINES ParisTech, l’une des plus prestigieuses écoles d'ingénieurs françaises, travaille avec des entreprises et des universités du monde entier. L'institution publique détient plus de 30 millions d'euros de contrats de recherche annuels. Les chercheurs s’appuient sur des techniques d'observation expérimentales à base d’imagerie 2D et d'imagerie 3D non destructive à haut débit. Ces technologies génèrent d'énormes volumes de données, que les chercheurs collectent et analysent quotidiennement à l'aide d'outils sophistiqués, comme l'analyse d'images et la simulation mécanique. Pour traiter les données, les chercheurs devaient les déplacer à partir de plusieurs systèmes de stockage, ce qui nuisait à la productivité et entraînait souvent des duplications inutiles. La gestion et la maintenance de multiples systèmes de stockage coutaient aussi beaucoup de temps au service informatique. Pour accueillir de nouveaux outils tels que la tomographie et la corrélation d'images 3D, le Centre avait besoin d'une solution de stockage unifiée, capable de fournir d'excellentes performances, tout en supportant une croissance continue des données. L’autre priorité était d'offrir une expérience utilisateur positive à tous - y compris aux 70 chercheurs utilisateurs de calcul haute performance (HPC) et aux 130 utilisateurs des applications de partage de fichiers du système.
MINES ParisTech a évalué plusieurs solutions de stockage de fichiers parallèles et de stockage d’objets avant de choisir l’ActiveStor de Panasas, un appareil HPC plug-and-play sur lequel tourne le système de fichiers parallèles PanFS. « Nous avons choisi ActiveStor pour sa combinaison unique de haute performance, d'évolutivité et de simplicité d'administration, » explique Gregory Sainte-Luce, Responsable Informatique du Centre de recherche sur les matériaux et membre du conseil d'administration informatique de MINES ParisTech. Basé sur une technologie de stockage réactive et évolutive, installé au Centre de recherche des matériaux, le système ActiveStor fonctionne 24 heures sur 24 et 7 jours sur 7, et offre aux utilisateurs un accès parallèle réactif au stockage, avec des performances élevées et constantes, même en cas de charges de travail lourdes, simultanées et mixtes.

Jusqu’à 1 téraoctet de stockage par simulation
Les tâches HPC du Centre varient de quelques heures à plusieurs jours, 24 heures sur 24. La tâche HPC la plus gourmande en ressources est l'analyse de données de tomographie, qui peut durer plusieurs jours. L'exécution d'une seule tâche de tomographie peut mobiliser de 10 à 100 Go de stockage, et le Centre en exécute des centaines dans le cadre de ses expériences. Les simulations par éléments finis à grande échelle du comportement des matériaux nécessitent jusqu'à 1 téraoctet (To) de stockage par simulation. Le Centre doit s'assurer que les chercheurs ont un accès rapide aux données.
La solution Panasas a répondu et dépassé les attentes des utilisateurs et du service informatique. « Les chercheurs gagnent du temps puisqu'ils n'ont plus à déplacer ou à copier les fichiers de données avant de pouvoir les traiter. » selon Gregory Sainte-Luce. « Ils gagnent en productivité puisqu'il n'y a plus de goulets d'étranglement au niveau HPC pour accéder au système de stockage. La bande passante est quatre à cinq fois plus élevée qu'auparavant. Et le partage de fichiers est plus pratique, grâce à des temps de réponse plus courts et à un débit plus élevé. » Grâce aux performances élevées et constantes d'ActiveStor, les utilisateurs ont désormais un accès rapide et simultané au stockage, même lorsque les charges de travail sont mixtes ou que le taux d'utilisation est très élevé.
Le Centre mène des études statistiques 4D, qui évaluent les contraintes mécaniques qui se produisent au cours du temps. Le processus d'essai 4D génère automatiquement un jumeau numérique de l'échantillon de matériau, ce qui permet aux analystes de simuler les performances et de valider les modèles de comportement utilisés par leurs partenaires industriels. « L'analyse d'essais 4D faisant appel à de très gros volumes de données peut prendre plusieurs mois, voire un an, » explique Henry Proudhon, chercheur au Centre. « Nous traitons en général 1 To de données pour chaque jour de l'expérience, avec 15 à 20 jours d'expériences par an. Une étude moyenne peut nécessiter une centaine de tâches HPC qui durent en moyenne six heures par jour. »

Un accès aux données cinq fois plus rapide pour le stockage HPC
En tant qu'utilisateur, Henry Proudhon apprécie la façon dont ActiveStor améliore la disponibilité des données HPC, et accélère ainsi l’obtention des résultats. « Panasas permet de traiter de gros volumes que l'on peut augmenter ou réduire rapidement, en fonction des besoins, » explique Gregory Sainte-Luce. « Nous fonctionnons actuellement à 80% de notre capacité de stockage et notre niveau de charge est de 17 à 20%, selon l’outil de suivi de Panasas. L'accès aux données est cinq fois plus rapide pour le stockage HPC, et nous avons même constaté une amélioration des performances et du confort pour les autres utilisateurs qui ne font pas de HPC. Nous n'avons pratiquement plus de données dupliquées. ActiveStor gère toute la charge de travail du laboratoire de recherche sans rencontrer le moindre problème de performance. » De plus, la centralisation des serveurs et des matrices de stockage en une seule solution convergente a permis au Centre de réduire les besoins des utilisateurs en matière de transfert de données entre dispositifs de stockage distincts.
La gestion simplifiée d’ActiveStor a considérablement réduit les besoins du Centre en matière de gestion du stockage. La simplicité de gestion de la solution a permis d'éliminer de gros efforts d'ingénierie, tout en réduisant le temps de gestion global. L'agrégation automatique des ressources de stockage libère les administrateurs de la nécessité de configurer des règles hiérarchiques complexes de gestion du stockage.
L'interface graphique intuitive à base web permet à un administrateur unique de gérer et de maintenir les quotas et les volumes en n’y consacrant seulement une quarantaine d’heures par an. ActiveStor envoie automatiquement des avertissements de quota aux administrateurs par e-mail, ce qui leur permet d'ajuster rapidement et dynamiquement l'espace disque en fonction des besoins, sans aucune interruption de service.
« L'ajout d'un nouveau rack est un processus sans risque et transparent qui prend moins d'une heure, » explique Gregory Sainte-Luce. « ActiveStor rééquilibre automatiquement les données stockées entre tous les serveurs de stockage du nouveau système, sans aucune dégradation des performances. La distribution plus équilibrée des données a considérablement amélioré les performances de notre système. »

Un stockage plus fiable et moins coûteux
Depuis le déploiement d'ActiveStor, les utilisateurs n'ont connu aucun arrêt système. Plusieurs serveurs de gestion de métadonnées et de systèmes de fichiers assurent la redondance, ce qui augmente la disponibilité et la résilience. « Les administrateurs passent moins de temps à gérer le stockage, ce qui leur permet de se concentrer sur d'autres activités, » explique Gregory Sainte-Luce. « Dans l'ensemble, le fonctionnement sans faille d'ActiveStor nous a permis de réduire les coûts de gestion du stockage. »

Flexibilité pour soutenir la croissance
ActiveStor offre à MINES ParisTech l'échelonnabilité nécessaire pour répondre à ses besoins de stockage présents et à venir. Panasas gère la charge de travail actuelle de l'ensemble du groupe de recherche, et peut facilement s'adapter à l'évolution des besoins, en augmentant ou en réduisant les quotas des volumes physiques ou logiques. « L'échelonnabilité est l'un des principaux avantages de la solution Panasas, » déclare Gregory Sainte-Luce. « C'est une technologie que l'on peut échelonner pratiquement sans effort pour répondre à la demande. »

ActiveStor permet également aux chercheurs d’accomplir davantage. « Lorsque les chercheurs peuvent accéder plus rapidement à leurs données scientifiques, atteindre un débit de travail plus élevé et effectuer davantage de calculs, ils peuvent accomplir davantage de tâches, » explique Gregory Sainte-Luce. « Leur productivité nous permet de vendre plus de contrats à nos partenaires et de développer notre activité. Nous sommes particulièrement ravis d'avoir Panasas comme partenaire. »

Alain DieulLa mission de PEI est de fournir à ses lecteurs des informations sur les nouveaux produits et services liés au secteur de l'industrie et qui sont disponibles sur le marché français. 

Pour paraître dans PEI Magazine et/ou sur le site pei-france.com, veuillez envoyer vos communiqués de presse à Alain Dieul.

Pour discuter d'une contribution rédactionnelle ou pour tous renseignements, contacter la rédaction de PEI.

Plus d'articles Contact