Abstract

Nowadays there is a great interest on developing new technologies for high-performance computing using grid and cluster environment integrated together. Storage systems is currently one of the major problems in this kind of installations for high-performance computing applications, involving aspects related to performance and usability. Access to data is still an unresolved problem, specially when the whole storage hierarchy is considered because of problems of heterogeneity and the always growing unbalance between the storage system bandwidth and the computing power of the compute nodes. The last problem is becoming specially important with the arrival of new multicore architectures. In this project we propose to develop a new data access technology for grids and clusters relying on the integration of the already existing input/output mechanisms for the whole storage hierarchy. A triple goal is pursued: to develop new techniques to provide scalable storage in grid environments, to propose new storage techniques and architectures for clusters, and to develop, from the applications point of view, techniques for distributing and organizing data to enhance the performance of input/output operations.

Presentación

En la actualidad existe un gran interés en desarrollar tecnologías para computación de altas prestaciones que utilizan como plataformas clusters y entornos grid. El almacenamiento en instalaciones de este tipo es en la actualidad uno de los problemas más importantes de la computación de altas prestaciones tanto desde el punto de vista de prestaciones como de usabilidad. El acceso o a los datos sigue siendo un problema no resuelto, sobre todo cuando se une con la cadena completa de la jerarquía de almacenamiento que suele presentar gran heterogeneidad y un cada vez mayor desequilibrio entre el ancho de banda soportado por el sistema de almacenamiento frente a la capacidad de cómputo de los procesadores. Esto último se agudiza especialmente con la aparición de las nuevas arquitecturas multicore.

En este proyecto se propone desarrollar una tecnología de acceso a datos en grids y clusters que se base en la integración de mecanismos de E/S ya existentes en toda la cadena de almacenamiento de datos. El objetivo es triple: desarrollar nuevas técnicas de almacenamiento escalable para entornos grid, proponer nuevas técnicas de almacenamiento para entornos cluster y desarrollar, desde el punto de vista de la aplicaciones, técnicas de distribución y organización de datos para la mejora del rendimiento en operaciones de entrada/salida.