Sistemas de almacenamiento RAID

Una promesa que se concreta (I)

En sus seis años de existencia, el concepto RAID ha dado lugar a más comentarios que a verdaderas implementaciones. Sin embargo, con la caída de los precios y un mayor interés por parte de los entornos PC LAN, existen motivos para reconsiderar esta tecnología de almacenamiento de datos.

Los "conjuntos redundantes de discos de bajo costo" o RAID (Redundant Arrays of Inexpensive Disks) fueron el resultado de los trabajos de tres investigadores de la Universidad de California. Sin embargo, aunque este concepto ha estado vigente ya desde hace algún tiempo, los sistemas RAID de tipo comercial sólo están disponibles desde hace cuatro años aproximadamente.

Los sistemas RAID actuales utilizan múltiples discos de 5,25 pulgadas para ofrecer lo que al usuario o al host se le aparece como un único disco virtual. Los sistemas más pequeños oscilan en la gama de 5 GB a 10 GB, y los sistemas grandes ofrecen 50, 60 ó 70 GB de almacenamiento por conjunto. Los sistemas RAID de mayor tamaño pueden llegar a ofrecer hasta un terabyte de almacenamiento.

La finalidad principal de los sistemas RAID es ofrecer un alto grado de capacidad, disponibilidad y redundancia de datos. El grado real de tolerancia a fallos varía según el nivel RAID que se elija. No obstante, todos los niveles RAID (excepto RAID 0) pueden reconstruir los datos almacenados en cualquier disco del "array" o conjunto que haya fallado, a partir de la información almacenada en los discos restantes. En muchos casos, la reconstrucción puede tener lugar con sólo pequeñas fluctuaciones en el servicio al usuario final.

Sin embargo, los sistemas RAID se enfrentan a algunas barreras en el intento de ganar aceptación general. Uno de los inconvenientes es su precio, que puede ser varias veces superior al de una cantidad equivalente de espacio de almacenamiento en una sola unidad de discos. También es un obstáculo su complejidad inherente y la ausencia de un conocimiento general sobre esta tecnología.

No obstante, todo esto podría cambiar. No sólo están bajando los precios de la tecnología RAID, sino que también está aumentando el interés por estos sistemas.

El motivo de este interés está en los números. En 1993, la capacidad media de disco servidor era de sólo 25 GB, según la firma Peripheral Concepts, por lo que una red difícilmente podía justificar la utilización de un conjunto de discos. Sin embargo, en 1995, una instalación media tiene entre 40 y 50 GB de almacenamiento en disco. Al aumentar las necesidades de almacenamiento, resultan más obvias las ventajas de la redundancia. La mayoría de los nuevos productos RAID están dirigidos también al sector de almacenamiento de datos en redes LAN.

Aunque los vendedores están finalmente en condiciones de ofrecer tecnología RAID, la cuestión pendiente es saber si los usuarios estarán en condiciones de adquirirla.

La élite RAID

Hasta la fecha, los sistemas RAID han atraído sólo a aquellos que están dispuestos a pagar los mayores costos de esta tecnología a cambio de sus ventajas en fiabilidad y disponibilidad. No sólo los conjuntos RAID ofrecen valores elevados de tiempo medio entre fallos (MTBF) y de tiempo medio entre pérdidas de datos (MTBDL), sino que los vendedores incluyen también características de tolerancia a fallos, como controladores redundantes, alimentaciones y memoria cache RAM no volátil, para ofrecer un grado aún mayor de protección.

Cruzar la línea de la unidad

Aunque algunos usuarios están obteniendo de sus conjuntos de discos más fiabilidad, capacidad y disponibilidad, no están obteniendo necesariamente un mayor rendimiento. En la mayor parte de las configuraciones RAID, el rendimiento no es el mismo que se obtendría en una sola unidad.

Naturalmente, hay excepciones a esa regla: diferentes niveles de RAID ofrecen un rendimiento óptimo para tipos específicos de aplicaciones. No obstante, lo que generalmente hace disminuir la velocidad de un sistema RAID es la mayor cantidad de mensajes de datos que deben tener lugar entre el controlador y el disco. Al fraccionar los datos, se establece la paridad y finalmente se escriben los datos.

Para aumentar el rendimiento, tiene que tener lugar más trabajo en el firmware, por ejemplo, mediante mejores algoritmos de asignación de datos.

El rendimiento del sistema RAID no es actualmente una gran preocupación en la mayor parte de los entornos LAN, en los que es más corriente que sea la red misma el cuello de botella en la transferencia de datos. Sin embargo, en un próximo futuro, los servidores multimedia que incorporan video o las estaciones de trabajo clientes deberán esperar un nivel bastante alto de transmisión de datos con un ancho de banda bastante elevado.

El coste del rendimiento

No obstante, muchos vendedores de productos RAID, en su búsqueda de cifras de rendimiento cada vez mayores, han afectado bastante negativamente a la fiabilidad de datos de los sistemas RAID, que antes era objeto de tantos elogios.

La forma más fácil para los fabricantes de aumentar las cifras de rendimiento es utilizar memorias cache de bastante tamaño en sus controladores. Esto ha dado lugar a lo que se llama el "hueco" en la escritura RAID. Este es en esencia el espacio de tiempo entre la actividad de "caching" y la escritura física propiamente dicha. Incluso en un sistema de un solo disco, un fallo de corriente entre una operación de escritura -entre el "caching" y la escritura física- puede ser un problema. Sin embargo, con los sistemas RAID el problema es más complejo.

En la mayor parte de las formas de RAID, las cabezas de escritura no están sincronizadas, de manera que el bloque de datos puede ser escrito antes del bloque de paridad. En consecuencia, un fallo de corriente entre estas dos operaciones puede crear una situación de fuera-de-paridad sin que el sistema tenga conocimiento de ello, ya que éste ha visto todo el proceso de escritura como una sola operación.

El resultado de esto es que, cuando el disco es reconstruido subsiguientemente, la paridad para los nuevos datos será la paridad antigua (o viceversa), alterando los datos allí donde ha tenido lugar la zona o "banda" que quedó fuera-de-paridad.

Los diversos niveles RAID están dando también lugar a confusión. No sólo existen los niveles RAID 0 a RAID 5 inclusive, sino también RAID 5 Plus, 6 y 7. Estas designaciones son reflejo en su mayor parte de intentos de los vendedores por mejorar la disponibilidad de Entrada/Salida o de los datos.

RAID 5 Plus y RAID 7 no son aceptados como nomenclatura estándar. No obstante, RAID 6 aparecía descrito por los investigadores originales en un documento reciente. En este nivel se amplía la fiabilidad añadiendo un segundo disco de paridad a un conjunto RAID 5. De esta forma, se obtiene una fiabilidad de datos extraordinariamente alta (tendrían que fallar tres discos simultáneamente para que se perdieran los datos), pero también se requiere un mayor esfuerzo extra u "overhead". Asimismo, se produce una grave disminución en el rendimiento de escritura, ya que hay que escribir dos bloques de paridad por cada bloque de datos.

El futuro de RAID

Son estas inseguridades respecto a RAID -la falta de experiencia y conocimientos sobre cómo funcionará- las que podrían seguir manteniéndolo apartado de una audiencia mayor. A pesar de estas limitaciones, el mercado probablemente crecerá en el sector de redes LAN. Algunos usuarios podrían utilizar RAID para una aplicación tradicional de alta fiabilidad, y encontrarlo aplicable también para otros entornos de proceso no previstos.

Otros podrían descubrir RAID cuando sus redes asumieran el aura de responsabilidad del mainframe, y las fuerzas de un rápido crecimiento les obligaran a buscar alternativas.

Distribución en discos

RAID Nivel 0

<

Contenido Patrocinado

Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital