SlideShare una empresa de Scribd logo
1 de 30
 Siglas que significan Redundant Array of Independent Disks, “Conjunto Redundante de
Discos Independientes”. Es un sistema de almacenamiento que usan múltiples unidades
(Discos Duros o SSD) para distribuir y/o replicar los datos. Existen varias configuraciones
que son llamadas niveles, cada nivel ofrece características como:
 mayor integridad
 mayor tolerancia a fallos
 mayor throughput (rendimiento)
 mayor capacidad
 Los sistemas RAID aparecieron gracias a la habilidad de combinar varios dispositivos de
bajo coste y tecnología más antigua en un conjunto que ofrecía mayor
capacidad, fiabilidad, velocidad o una combinación de éstas que un solo dispositivo de última
generación y coste más alto.
 Un RAID combina varios discos duros en una sola unidad lógica. Así, en lugar de ver varios
discos duros diferentes, el sistema operativo ve uno solo. Los RAIDs suelen usarse en
servidores y normalmente (aunque no es necesario) se implementan con unidades de disco de
la misma capacidad.
 Todas las implementaciones pueden soportar el uso de uno o más discos de reserva (hot
spare), unidades preinstaladas que pueden usarse inmediatamente (y casi siempre
automáticamente) tras el fallo de un disco del RAID. Esto reduce el tiempo del período de
reparación al acortar el tiempo de reconstrucción del RAID.
 Algunas compañías que ofrecen servicios RAID son:
Adaptec, Areca, Dawicontrol, Highpoint, HP, IBM, Intel, Leaf, LSI, Promise, Supermicro, H
DS, Lacie.
 RAID puede mejorar el uptime. Los niveles RAID 1, 0+1 o 10, 5 y 6 (sus variantes, como el
50) permiten que un disco falle mecánicamente y que aun así los datos del conjunto sigan
siendo accesibles para los usuarios. En lugar de exigir que se realice una restauración costosa
en tiempo desde una cinta, DVD o algún otro medio de respaldo lento, un RAID permite que
los datos se recuperen en un disco de reemplazo a partir de los restantes discos del
conjunto, mientras al mismo tiempo permanece disponible para los usuarios en un modo
degradado.
 RAID puede mejorar el rendimiento de ciertas aplicaciones. Los niveles RAID 0, 5 y 6 usan
variantes de división (striping) de datos, lo que permite que varios discos atiendan
simultáneamente las operaciones de lectura lineales, aumentando la tasa de transferencia
sostenida. Las aplicaciones de escritorio que trabajan con archivos grandes, como la edición
de vídeo e imágenes, se benefician de esta mejora. También es útil para las operaciones de
copia de respaldo de disco a disco. Además, si se usa un RAID 1 o un RAID basado en
división con un tamaño de bloque lo suficientemente grande se logran mejoras de
rendimiento para patrones de acceso que implique múltiples lecturas simultáneas (por
ejemplo, bases de datos multiusuario).
 RAID no protege los datos. Un conjunto RAID tiene un sistema de archivos, lo que
supone un punto único de fallo al ser vulnerable a una amplia variedad de riesgos
aparte del fallo físico de disco, por lo que RAID no evita la pérdida de datos por
estas causas.
 RAID no simplifica la recuperación de un desastre. Cuando se trabaja con un solo
disco, éste es accesible normalmente mediante un controlador ATA o SCSI incluido
en la mayoría de los sistemas operativos. Sin embargo, las controladoras RAID
necesitan controladores software específicos.
 RAID no mejora el rendimiento de todas las aplicaciones.
 RAID no facilita el traslado a un sistema nuevo. Cuando se usa un solo disco, es
relativamente fácil trasladar el disco a un sistema nuevo: basta con conectarlo, si
cuenta con la misma interfaz. Con un RAID no es tan sencillo: la BIOS RAID debe
ser capaz de leer los metadatos de los miembros del conjunto para reconocerlo
adecuadamente y hacerlo disponible al sistema operativo.
• RAID 0
• RAID 1
• RAID 2
• RAID 3
• RAID 4
• RAID 5
• RAID 6
• RAID 5E y 6E
Niveles
RAID
estándar
• RAID 0+1
• RAID 1+0
• RAID 30
• RAID 100
• RAID 10+1
Niveles
RAID
anidados
• RAID 50EE
• Paridad Doble
• RAID 1.5
• RAID 7
• RAID S o RAID de paridad
• Matrix RAID
• Linux MD RAID 10
• IBM ServeRAID 1E
• RAID Z
Niveles
RAID
propietarios
Los niveles RAID estándar son un conjunto básico de
configuraciones RAID y implementación de
“striping”, “mirroring(espejeado)”, o pariedad. Hubieron
cinco niveles de RAID al inicio, pero muchas más variaciones
aparecieron, niveles anidados, y algunos niveles no
estandarizados (mayormente propietarios). Los niveles RAID
y sus formatos de almacenar los datos están estandarizados
por la Storage Networking Industry Association (SNIA) en la
norma de Formato de Almacenamiento de Discos RAID
(DDF).
Distribuye los datos a través de varios
discos. Este tipo de configuración no
proporciona redundancia (no es
precisamente RAID), pero maneja varios
discos como si fueran uno solo, lo que
proporciona una mayor velocidad de
lectura y escritura. Lamentablemente, si
un disco falla en un arreglo Nivel 0, el
sistema se cae. El nivel 0 requiere al
menos 2 discos, siendo muy útil cuando
se desea añadir capacidad de disco sin
aumentar nombres de identificación de
volumen.
Utiliza espejeado (mirroring) para proveer la mejor
redundancia tolerante a fallas disponible (los discos
guardan exactamente la misma información por
parejas). Cuando un disco espejeado falla, el
segundo toma su lugar. El problema se presenta
cuando se escriben datos deteriorados en un
disco, pues son duplicados con los mismos defectos
en el disco espejo. El espejeado generalmente es
poco práctico y costoso, especialmente cuando se
almacenan datos en el orden de cientos de
gigabytes. Inclusive con los bajos costos actuales
de los discos duros, RAID Nivel 1 solo tiene
sentido para datos de misión crítica que deben estar
disponibles permanentemente en línea. El Nivel 1
requiere al menos de 2 discos para su
implementación.
Utiliza códigos de corrección
Hamming. Está diseñado para
ser utilizado con discos que
carecen de detección de error
interna (discos antiguos).
Todos los discos SCSI
soportan detección de error
interna, por lo que este nivel
de RAID tiene muy poca
utilidad práctica para esos
modelos de discos.
Introduce el chequeo de pariedad, o la
corrección de errores. Distribuye los
datos a través de múltiples discos al
nivel de bytes, y añade redundancia
mediante la utilización de un disco de
pariedad dedicado, que detecta errores
en los datos almacenados producidos
por una falla de cualquier disco, y los
reconstruye mediante algoritmos
especiales. Si la falla se produce en el
disco de pariedad, se pierde la
redundancia, pero se mantiene intacta
la información original. Debido a que
RAID Nivel 3 escribe los datos en
grandes bloques de información, es
una alternativa apropiada para
aplicaciones tales como video que
envían y reciben grandes archivos.
Distribuye los datos a nivel de bloque
(la principal diferencia con el nivel
3), a través de varios discos, con la
pariedad almacenada en un disco. La
información de pariedad permite la
recuperación de cualquier disco en caso
de falla. El rendimiento de un arreglo
nivel 4 es muy bueno para lecturas
(similar al nivel 0). Sin embargo, la
escritura requiere que los datos de
pariedad sean actualizados cada vez.
Esto retarda particularmente las
escrituras aleatorias pequeñas, aunque
las escrituras grandes o secuenciales
son razonablemente rápidas. Debido a
que solamente un disco es del arreglo
es utilizado para datos redundantes, el
costo por megabyte de un arreglo nivel
4 es relativamente bajo.
Es la alternativa más popular. El Nivel 5 crea
datos de pariedad, distribuyéndolos a través
de todos los discos (excepto en aquel disco
en que se almacena la información
original), obviando la necesidad de un disco
de pariedad dedicado. El Nivel 5 es el más
completo de todos los niveles de redundancia
por distribución, por que si un disco falla, la
información de pariedad en los otros permite
la reconstrucción de toda su información.
Aún más, el Nivel 5 escribe datos en los
discos al nivel de bloques (en lugar de
trabajar al nivel de bytes), volviéndolo más
apropiado para múltiples transacciones
pequeñas como e-mail, procesadores de
palabras, hojas electrónicas, y aplicaciones
de bases de datos. Los niveles 3 y 5 requieren
al menos de 3 discos para su
implementación.
Similar al RAID 5, pero incluye un
segundo esquema de paridad distribuido
por los distintos discos y por tanto ofrece
tolerancia extremadamente alta a los fallos
y a las caídas de disco, ofreciendo dos
niveles de redundancia. Hay pocos
ejemplos comerciales en la actualidad, ya
que su coste de implementación es mayor
al de otros niveles RAID, ya que las
controladoras requeridas que soporten esta
doble paridad son más complejas y caras
que las de otros niveles RAID. Así
pues, comercialmente no se implementa.
Se suele llamar RAID 5E y RAID 6E a las
variantes de RAID 5 y RAID 6 que incluyen
discos de reserva. Estos discos pueden estar
conectados y preparados (hot spare) o en
espera (standby spare). En los RAIDs 5E y
RAID 6E, los discos de reserva están
disponibles para cualquiera de las unidades
miembro. No suponen mejora alguna del
rendimiento, pero sí se minimiza el tiempo de
reconstrucción (en el caso de los discos hot
spare) y las labores de administración cuando
se producen fallos. Un disco de reserva no es
realmente parte del conjunto hasta que un
disco falla y el conjunto se reconstruye sobre
el de reserva.
Permite que un RAID pueda usarse como elemento básico de otro
en lugar de discos físicos. Resulta instructivo pensar en estos
conjuntos como capas dispuestas unas sobre otras, con los discos
físicos en la inferior. Los RAIDs anidados se indican normalmente
uniendo en un solo número los correspondientes a los niveles RAID
usados, añadiendo a veces un «+» entre ellos. Al anidar niveles
RAID, se suele combinar un nivel RAID que proporcione
redundancia con un RAID 0 que aumenta el rendimiento. Con estas
configuraciones es preferible tener el RAID 0 como nivel más alto y
los conjuntos redundantes debajo, porque así será necesario
reconstruir menos discos cuando uno falle.
El RAID 0+1 (STRIPPING +
MIRRORING), consiste en la
duplicación de los datos en
diferentes conjuntos de
discos, para un posterior stripping
dentro de cada uno de dichos
conjuntos. Este nivel está indicado
para aplicaciones que necesiten
altas prestaciones y un alto nivel
de seguridad.
Aplicaciones: Aplicaciones de
Imagen, Servidores de archivos
generales.
A veces llamado RAID 10, es parecido a un
RAID 0+1 con la excepción de que los niveles
RAID que lo forman se invierte: el RAID 10 es
una división de espejos. En cada división RAID 1
pueden fallar todos los discos salvo uno sin que
se pierdan datos. Sin embargo, si los discos que
han fallado no se reemplazan, el restante pasa a
ser un punto único de fallo para todo el conjunto.
Si ese disco falla entonces, se perderán todos los
datos del conjunto completo. Como en el caso del
RAID 0+1, si un disco que ha fallado no se
reemplaza, entonces un solo error de medio
irrecuperable que ocurra en el disco espejado
resultaría en pérdida de datos. El RAID 10 es a
menudo la mejor elección para bases de datos de
altas prestaciones, debido a que la ausencia de
cálculos de paridad proporciona mayor velocidad
de escritura.
El RAID 30 o división con conjunto de
paridad dedicado es una combinación de un
RAID 3 y un RAID 0. El RAID 30
proporciona tasas de transferencia elevadas
combinadas con una alta fiabilidad a
cambio de un coste de implementación
muy alto. La mejor forma de construir un
RAID 30 es combinar dos conjuntos RAID
3 con los datos divididos en ambos
conjuntos. El RAID 30 trocea los datos en
bloque más pequeños y los divide en cada
conjunto RAID 3, que a su vez lo divide en
trozos aún menores, calcula la paridad
aplicando un XOR a cada uno y los
escriben en todos los discos del conjunto
salvo en uno, donde se almacena la
información de paridad.
Un RAID 100, a veces llamado también
RAID 10+0, es una división de conjuntos
RAID 10. El RAID 100 es un ejemplo de
RAID cuadriculado, un RAID en el que
conjuntos divididos son a su vez divididos
conjuntamente de nuevo. Todos los discos
menos unos podrían fallar en cada RAID 1
sin perder datos. Sin embargo, el disco
restante de un RAID 1 se convierte así en un
punto único de fallo para el conjunto
degradado. A menudo el nivel superior de
división se hace por software. Los principales
beneficios de un RAID 100 (y de los RAIDs
cuadriculados en general) sobre un único
nivel RAID son mejor rendimiento para
lecturas aleatorias y la mitigación de los
puntos calientes de riesgo en el conjunto. Es
la mejor elección para bases de datos muy
grandes, donde el conjunto software
subyacente limita la cantidad de discos
físicos permitidos en cada conjunto estándar.
Implementar niveles RAID anidados permite
eliminar virtualmente el límite de unidades
físicas en un único volumen lógico.
Un RAID 10+1, es un reflejo de dos RAID 10. Se
utiliza en la llamados Network RAID que aceptan
algunas cabinas de datos. Es un sistema de alta
disponibilidad por red, lo que permite la replicación de
datos entre cabinas a nivel de RAID, con lo cual se
simplifica ampliamente la gestión de replicación de
cabinas. El RAID 10+1, tratándose de espejos de
RAID10 que tienen una gran velocidad de acceso, hace
que el rendimiento sea muy aceptable, siempre y
cuando se respete el requerimiento de 2ms de latencia
como máximo.
Aunque todas las implementaciones de RAID
difieren en algún grado de la especificación
idealizada, algunas compañías han desarrollado
implementaciones RAID completamente propietarias
que difieren sustancialmente de todas las demás.
Himperia utiliza el RAID 50EE en el ZStore 3212L.
Se trata de un RAID 0 de dos pools, cada uno de
ellos con RAID 5EE (7+1+1). Tolera el fallo
simultáneo de dos discos, y hasta 4 discos no
simultáneos. El tiempo de reconstrucción se reduce al
mínimo, gracias al RAID 5EE. Y se mejora el
rendimiento gracias al RAID 0.
La paridad doble, a veces implementada y
conocida como paridad diagonal es similar
al RAID 6, hay dos conjuntos de información
de chequeo de paridad, pero a diferencia de
aquél, el segundo conjunto no es otro
conjunto de puntos calculado sobre un
síndrome polinomial diferente para los
mismos grupos de bloques de datos, sino que
se calcula la paridad extra a partir de un grupo
diferente de bloques de datos. Por
ejemplo, sobre el gráfico tanto el RAID 5
como el RAID 6 calcularían la paridad sobre
todos los bloques de la letra A para generar
uno o dos bloques de paridad. Sin
embargo, es bastante fácil calcular la paridad
contra múltiples grupos de bloques, en lugar
de sólo sobre los bloques de la letra A: puede
calcularse la paridad sobre los bloques de la
letra A y un grupo permutado de bloques. No
es recomendable que el sistema de paridad
doble funcione en modo degradado debido a
su bajo rendimiento.
RAID 1.5 es un nivel RAID
propietario de HighPoint a
veces llamado erróneamente
RAID 15. Por la poca
información disponible, parece
ser una implementación
correcta de un RAID 1.
Cuando se lee, los datos se
recuperan de ambos discos
simultáneamente y la mayoría
del trabajo se hace en hardware
en lugar de en el controlador
software.
El RAID 7, este tipo incluye un
sistema operativo incrustado de
tiempo real como
controlador, haciendo las
operaciones de caché a través de
un bus de alta velocidad y otras
características de un ordenador
sencillo. Todas las transferencias
son asíncronas. Y las E/S están
centralizadas por la caché. Se
necesita un disco de paridad
exclusivo. El agente SNMP
permite su administración remota.
Es una marca registrada de Storage
Computer Corporation
Aplicaciones: Sistemas de Tiempo
Real (Industriales).
RAID S es un sistema RAID de paridad
distribuida propietario de EMC Corporation
usado en sus sistemas de almacenamiento
Symmetrix. Cada volumen reside en un único
disco físico, y se combinan arbitrariamente varios
volúmenes para el cálculo de paridad. EMC
llamaba originalmente a esta característica RAID
S y luego la rebautizó RAID de paridad (Parity
RAID) para su plataforma Symmetrix DMX.
EMC ofrece también actualmente un RAID 5
estándar para el Symmetrix DMX.
Matrix RAID o matriz RAID es una
característica que apareció por vez
primera en la BIOS RAID Intel
ICH6R, mas no es un nuevo nivel
RAID. El Matrix RAID utiliza dos o
más discos físicos, asignando partes
de idéntico tamaño de cada uno de
ellos diferentes niveles de RAID. Este
producto está dirigido a los usuarios
domésticos, proporcionando una zona
segura (la sección RAID 1) para
documentos y otros archivos que se
desean almacenar redundantemente y
una zona más rápida (la sección
RAID 0) para el sistema
operativo, aplicaciones, etcétera.
La controladora RAID software del kernel
de Linux (llamada md, de multiple
disk, „disco múltiple‟) puede ser usada
para construir un conjunto RAID 1+0
clásico, pero también permite un único
nivel RAID 10 con algunas extensiones
interesantes. En particular, soporta un
espejado de k bloques en n unidades
cuando k no es divisible por n. Esto se
hace repitiendo cada bloque k veces al
escribirlo en un conjunto RAID 0
subyacente de n unidades. Evidentemente
esto equivale a la configuración RAID 10
estándar. Linux también permite crear
otras configuraciones RAID usando la
controladora md (niveles 0, 1, 4, 5 y 6)
además de otros usos no RAID como
almacenamiento multiruta y LVM2.
La serie de adaptadores IBM
ServeRAID soportan un
espejado doble de un número
arbitrario de discos, como se
ilustra en el gráfico. Esta
configuración es tolerante a
fallos de unidades no
adyacentes. Otros sistemas de
almacenamiento como el
StorEdge T3 de Sun soportan
también este modo.
El sistema de archivos ZFS de Sun Microsystems
implementa un esquema de redundancia integrado
parecido al RAID 5 que se denomina RAID Z. Esta
configuración evita el “agujero de escritura” del RAID
5 y la necesidad de la secuencia leer-modificar-escribir
para operaciones de escrituras pequeñas efectuando
sólo escrituras de divisiones (stripes)
completas, espejando los bloques pequeños en lugar de
protegerlos con el cálculo de paridad, lo que resulta
posible gracias a que el sistema de archivos conoce la
estructura de almacenamiento subyacente y puede
gestionar el espacio adicional cuando lo necesita.

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Sistema de archivos
Sistema de archivosSistema de archivos
Sistema de archivos
 
Almacenamiento y estructura de archivos
Almacenamiento y estructura de archivosAlmacenamiento y estructura de archivos
Almacenamiento y estructura de archivos
 
Raid
RaidRaid
Raid
 
Raid
Raid Raid
Raid
 
4.4 Acceso a sistema de archivos
4.4 Acceso a sistema de archivos4.4 Acceso a sistema de archivos
4.4 Acceso a sistema de archivos
 
Herramientas bind
Herramientas bindHerramientas bind
Herramientas bind
 
Gestion de memoria en Linux
Gestion de memoria en LinuxGestion de memoria en Linux
Gestion de memoria en Linux
 
RAID CONCEPT
RAID CONCEPTRAID CONCEPT
RAID CONCEPT
 
RAID-Tolerancia a Fallos
RAID-Tolerancia a FallosRAID-Tolerancia a Fallos
RAID-Tolerancia a Fallos
 
DAS RAID NAS SAN
DAS RAID NAS SANDAS RAID NAS SAN
DAS RAID NAS SAN
 
Raid technology
Raid technologyRaid technology
Raid technology
 
Course 102: Lecture 14: Users and Permissions
Course 102: Lecture 14: Users and PermissionsCourse 102: Lecture 14: Users and Permissions
Course 102: Lecture 14: Users and Permissions
 
Sistemas operativos procesos
Sistemas operativos   procesosSistemas operativos   procesos
Sistemas operativos procesos
 
Teradata training
Teradata trainingTeradata training
Teradata training
 
Raid
Raid Raid
Raid
 
Sistemas Operativos Gestion de procesos
Sistemas Operativos Gestion de procesosSistemas Operativos Gestion de procesos
Sistemas Operativos Gestion de procesos
 
Present of Raid and Its Type
Present of Raid and Its TypePresent of Raid and Its Type
Present of Raid and Its Type
 
FREEBSD
FREEBSDFREEBSD
FREEBSD
 
Programación I 2. Arquitectura de Capas
Programación I 2. Arquitectura de CapasProgramación I 2. Arquitectura de Capas
Programación I 2. Arquitectura de Capas
 
Sistemas operativos - Sistemas De Archivos - reporte unidad 5
Sistemas operativos - Sistemas De Archivos - reporte unidad 5Sistemas operativos - Sistemas De Archivos - reporte unidad 5
Sistemas operativos - Sistemas De Archivos - reporte unidad 5
 

Similar a Sistemas de almacenamiento RAID (20)

sistemas RAID.pptxhjjjjjjjjjjjjjjjghbhhjjj
sistemas RAID.pptxhjjjjjjjjjjjjjjjghbhhjjjsistemas RAID.pptxhjjjjjjjjjjjjjjjghbhhjjj
sistemas RAID.pptxhjjjjjjjjjjjjjjjghbhhjjj
 
Raid (redundant array of independent disks)
Raid (redundant array of independent disks)Raid (redundant array of independent disks)
Raid (redundant array of independent disks)
 
Raid1 en Windows Server 2003 R2
Raid1 en Windows Server 2003 R2Raid1 en Windows Server 2003 R2
Raid1 en Windows Server 2003 R2
 
Discos Raid Arreglo redundancia de disco independientes
Discos Raid Arreglo redundancia de disco independientesDiscos Raid Arreglo redundancia de disco independientes
Discos Raid Arreglo redundancia de disco independientes
 
Sistemas RAID.pdf
Sistemas RAID.pdfSistemas RAID.pdf
Sistemas RAID.pdf
 
RAID
RAIDRAID
RAID
 
Tecnología RAID
Tecnología RAIDTecnología RAID
Tecnología RAID
 
RAID.pdf
RAID.pdfRAID.pdf
RAID.pdf
 
4 array redundante de discos independientes
4  array redundante de discos independientes4  array redundante de discos independientes
4 array redundante de discos independientes
 
4 array redundante de discos independientes
4  array redundante de discos independientes4  array redundante de discos independientes
4 array redundante de discos independientes
 
RAID
RAIDRAID
RAID
 
Nestor
NestorNestor
Nestor
 
RAID
RAIDRAID
RAID
 
Raid y particiones y ntfs
Raid y particiones y ntfsRaid y particiones y ntfs
Raid y particiones y ntfs
 
Sistemas RAID
Sistemas RAIDSistemas RAID
Sistemas RAID
 
Que Es RAID?
Que Es RAID?
Que Es RAID?
Que Es RAID?
 
Características y aplicaciones de RAID
Características y aplicaciones de RAIDCaracterísticas y aplicaciones de RAID
Características y aplicaciones de RAID
 
Raids
RaidsRaids
Raids
 
IntroduccióN
IntroduccióNIntroduccióN
IntroduccióN
 
Resumen Nuevas Tecnologias De Almacenamiento De Informacion
Resumen Nuevas Tecnologias De Almacenamiento De InformacionResumen Nuevas Tecnologias De Almacenamiento De Informacion
Resumen Nuevas Tecnologias De Almacenamiento De Informacion
 

Más de Jonathan Fabrizzio Argüello Valle (8)

Ediciones de windows 8 y Windows Server 2008
Ediciones de windows 8 y Windows Server 2008Ediciones de windows 8 y Windows Server 2008
Ediciones de windows 8 y Windows Server 2008
 
Community manager
Community managerCommunity manager
Community manager
 
Divisores de un número (código Dev C++)
Divisores de un número (código Dev C++)Divisores de un número (código Dev C++)
Divisores de un número (código Dev C++)
 
Tablas de multiplicar (código Dev C++)
Tablas de multiplicar (código Dev C++)Tablas de multiplicar (código Dev C++)
Tablas de multiplicar (código Dev C++)
 
Tecnología frame relay
Tecnología frame relayTecnología frame relay
Tecnología frame relay
 
Normalización de las bases de datos
Normalización de las bases de datosNormalización de las bases de datos
Normalización de las bases de datos
 
Unidad de Estado Sólido (SSD)
Unidad de Estado Sólido (SSD)Unidad de Estado Sólido (SSD)
Unidad de Estado Sólido (SSD)
 
ATM (Asynchronous Transfer Mode)
ATM (Asynchronous Transfer Mode)ATM (Asynchronous Transfer Mode)
ATM (Asynchronous Transfer Mode)
 

Sistemas de almacenamiento RAID

  • 1.
  • 2.  Siglas que significan Redundant Array of Independent Disks, “Conjunto Redundante de Discos Independientes”. Es un sistema de almacenamiento que usan múltiples unidades (Discos Duros o SSD) para distribuir y/o replicar los datos. Existen varias configuraciones que son llamadas niveles, cada nivel ofrece características como:  mayor integridad  mayor tolerancia a fallos  mayor throughput (rendimiento)  mayor capacidad  Los sistemas RAID aparecieron gracias a la habilidad de combinar varios dispositivos de bajo coste y tecnología más antigua en un conjunto que ofrecía mayor capacidad, fiabilidad, velocidad o una combinación de éstas que un solo dispositivo de última generación y coste más alto.  Un RAID combina varios discos duros en una sola unidad lógica. Así, en lugar de ver varios discos duros diferentes, el sistema operativo ve uno solo. Los RAIDs suelen usarse en servidores y normalmente (aunque no es necesario) se implementan con unidades de disco de la misma capacidad.  Todas las implementaciones pueden soportar el uso de uno o más discos de reserva (hot spare), unidades preinstaladas que pueden usarse inmediatamente (y casi siempre automáticamente) tras el fallo de un disco del RAID. Esto reduce el tiempo del período de reparación al acortar el tiempo de reconstrucción del RAID.  Algunas compañías que ofrecen servicios RAID son: Adaptec, Areca, Dawicontrol, Highpoint, HP, IBM, Intel, Leaf, LSI, Promise, Supermicro, H DS, Lacie.
  • 3.  RAID puede mejorar el uptime. Los niveles RAID 1, 0+1 o 10, 5 y 6 (sus variantes, como el 50) permiten que un disco falle mecánicamente y que aun así los datos del conjunto sigan siendo accesibles para los usuarios. En lugar de exigir que se realice una restauración costosa en tiempo desde una cinta, DVD o algún otro medio de respaldo lento, un RAID permite que los datos se recuperen en un disco de reemplazo a partir de los restantes discos del conjunto, mientras al mismo tiempo permanece disponible para los usuarios en un modo degradado.  RAID puede mejorar el rendimiento de ciertas aplicaciones. Los niveles RAID 0, 5 y 6 usan variantes de división (striping) de datos, lo que permite que varios discos atiendan simultáneamente las operaciones de lectura lineales, aumentando la tasa de transferencia sostenida. Las aplicaciones de escritorio que trabajan con archivos grandes, como la edición de vídeo e imágenes, se benefician de esta mejora. También es útil para las operaciones de copia de respaldo de disco a disco. Además, si se usa un RAID 1 o un RAID basado en división con un tamaño de bloque lo suficientemente grande se logran mejoras de rendimiento para patrones de acceso que implique múltiples lecturas simultáneas (por ejemplo, bases de datos multiusuario).
  • 4.  RAID no protege los datos. Un conjunto RAID tiene un sistema de archivos, lo que supone un punto único de fallo al ser vulnerable a una amplia variedad de riesgos aparte del fallo físico de disco, por lo que RAID no evita la pérdida de datos por estas causas.  RAID no simplifica la recuperación de un desastre. Cuando se trabaja con un solo disco, éste es accesible normalmente mediante un controlador ATA o SCSI incluido en la mayoría de los sistemas operativos. Sin embargo, las controladoras RAID necesitan controladores software específicos.  RAID no mejora el rendimiento de todas las aplicaciones.  RAID no facilita el traslado a un sistema nuevo. Cuando se usa un solo disco, es relativamente fácil trasladar el disco a un sistema nuevo: basta con conectarlo, si cuenta con la misma interfaz. Con un RAID no es tan sencillo: la BIOS RAID debe ser capaz de leer los metadatos de los miembros del conjunto para reconocerlo adecuadamente y hacerlo disponible al sistema operativo.
  • 5. • RAID 0 • RAID 1 • RAID 2 • RAID 3 • RAID 4 • RAID 5 • RAID 6 • RAID 5E y 6E Niveles RAID estándar • RAID 0+1 • RAID 1+0 • RAID 30 • RAID 100 • RAID 10+1 Niveles RAID anidados • RAID 50EE • Paridad Doble • RAID 1.5 • RAID 7 • RAID S o RAID de paridad • Matrix RAID • Linux MD RAID 10 • IBM ServeRAID 1E • RAID Z Niveles RAID propietarios
  • 6. Los niveles RAID estándar son un conjunto básico de configuraciones RAID y implementación de “striping”, “mirroring(espejeado)”, o pariedad. Hubieron cinco niveles de RAID al inicio, pero muchas más variaciones aparecieron, niveles anidados, y algunos niveles no estandarizados (mayormente propietarios). Los niveles RAID y sus formatos de almacenar los datos están estandarizados por la Storage Networking Industry Association (SNIA) en la norma de Formato de Almacenamiento de Discos RAID (DDF).
  • 7. Distribuye los datos a través de varios discos. Este tipo de configuración no proporciona redundancia (no es precisamente RAID), pero maneja varios discos como si fueran uno solo, lo que proporciona una mayor velocidad de lectura y escritura. Lamentablemente, si un disco falla en un arreglo Nivel 0, el sistema se cae. El nivel 0 requiere al menos 2 discos, siendo muy útil cuando se desea añadir capacidad de disco sin aumentar nombres de identificación de volumen.
  • 8. Utiliza espejeado (mirroring) para proveer la mejor redundancia tolerante a fallas disponible (los discos guardan exactamente la misma información por parejas). Cuando un disco espejeado falla, el segundo toma su lugar. El problema se presenta cuando se escriben datos deteriorados en un disco, pues son duplicados con los mismos defectos en el disco espejo. El espejeado generalmente es poco práctico y costoso, especialmente cuando se almacenan datos en el orden de cientos de gigabytes. Inclusive con los bajos costos actuales de los discos duros, RAID Nivel 1 solo tiene sentido para datos de misión crítica que deben estar disponibles permanentemente en línea. El Nivel 1 requiere al menos de 2 discos para su implementación.
  • 9. Utiliza códigos de corrección Hamming. Está diseñado para ser utilizado con discos que carecen de detección de error interna (discos antiguos). Todos los discos SCSI soportan detección de error interna, por lo que este nivel de RAID tiene muy poca utilidad práctica para esos modelos de discos.
  • 10. Introduce el chequeo de pariedad, o la corrección de errores. Distribuye los datos a través de múltiples discos al nivel de bytes, y añade redundancia mediante la utilización de un disco de pariedad dedicado, que detecta errores en los datos almacenados producidos por una falla de cualquier disco, y los reconstruye mediante algoritmos especiales. Si la falla se produce en el disco de pariedad, se pierde la redundancia, pero se mantiene intacta la información original. Debido a que RAID Nivel 3 escribe los datos en grandes bloques de información, es una alternativa apropiada para aplicaciones tales como video que envían y reciben grandes archivos.
  • 11. Distribuye los datos a nivel de bloque (la principal diferencia con el nivel 3), a través de varios discos, con la pariedad almacenada en un disco. La información de pariedad permite la recuperación de cualquier disco en caso de falla. El rendimiento de un arreglo nivel 4 es muy bueno para lecturas (similar al nivel 0). Sin embargo, la escritura requiere que los datos de pariedad sean actualizados cada vez. Esto retarda particularmente las escrituras aleatorias pequeñas, aunque las escrituras grandes o secuenciales son razonablemente rápidas. Debido a que solamente un disco es del arreglo es utilizado para datos redundantes, el costo por megabyte de un arreglo nivel 4 es relativamente bajo.
  • 12. Es la alternativa más popular. El Nivel 5 crea datos de pariedad, distribuyéndolos a través de todos los discos (excepto en aquel disco en que se almacena la información original), obviando la necesidad de un disco de pariedad dedicado. El Nivel 5 es el más completo de todos los niveles de redundancia por distribución, por que si un disco falla, la información de pariedad en los otros permite la reconstrucción de toda su información. Aún más, el Nivel 5 escribe datos en los discos al nivel de bloques (en lugar de trabajar al nivel de bytes), volviéndolo más apropiado para múltiples transacciones pequeñas como e-mail, procesadores de palabras, hojas electrónicas, y aplicaciones de bases de datos. Los niveles 3 y 5 requieren al menos de 3 discos para su implementación.
  • 13. Similar al RAID 5, pero incluye un segundo esquema de paridad distribuido por los distintos discos y por tanto ofrece tolerancia extremadamente alta a los fallos y a las caídas de disco, ofreciendo dos niveles de redundancia. Hay pocos ejemplos comerciales en la actualidad, ya que su coste de implementación es mayor al de otros niveles RAID, ya que las controladoras requeridas que soporten esta doble paridad son más complejas y caras que las de otros niveles RAID. Así pues, comercialmente no se implementa.
  • 14. Se suele llamar RAID 5E y RAID 6E a las variantes de RAID 5 y RAID 6 que incluyen discos de reserva. Estos discos pueden estar conectados y preparados (hot spare) o en espera (standby spare). En los RAIDs 5E y RAID 6E, los discos de reserva están disponibles para cualquiera de las unidades miembro. No suponen mejora alguna del rendimiento, pero sí se minimiza el tiempo de reconstrucción (en el caso de los discos hot spare) y las labores de administración cuando se producen fallos. Un disco de reserva no es realmente parte del conjunto hasta que un disco falla y el conjunto se reconstruye sobre el de reserva.
  • 15. Permite que un RAID pueda usarse como elemento básico de otro en lugar de discos físicos. Resulta instructivo pensar en estos conjuntos como capas dispuestas unas sobre otras, con los discos físicos en la inferior. Los RAIDs anidados se indican normalmente uniendo en un solo número los correspondientes a los niveles RAID usados, añadiendo a veces un «+» entre ellos. Al anidar niveles RAID, se suele combinar un nivel RAID que proporcione redundancia con un RAID 0 que aumenta el rendimiento. Con estas configuraciones es preferible tener el RAID 0 como nivel más alto y los conjuntos redundantes debajo, porque así será necesario reconstruir menos discos cuando uno falle.
  • 16. El RAID 0+1 (STRIPPING + MIRRORING), consiste en la duplicación de los datos en diferentes conjuntos de discos, para un posterior stripping dentro de cada uno de dichos conjuntos. Este nivel está indicado para aplicaciones que necesiten altas prestaciones y un alto nivel de seguridad. Aplicaciones: Aplicaciones de Imagen, Servidores de archivos generales.
  • 17. A veces llamado RAID 10, es parecido a un RAID 0+1 con la excepción de que los niveles RAID que lo forman se invierte: el RAID 10 es una división de espejos. En cada división RAID 1 pueden fallar todos los discos salvo uno sin que se pierdan datos. Sin embargo, si los discos que han fallado no se reemplazan, el restante pasa a ser un punto único de fallo para todo el conjunto. Si ese disco falla entonces, se perderán todos los datos del conjunto completo. Como en el caso del RAID 0+1, si un disco que ha fallado no se reemplaza, entonces un solo error de medio irrecuperable que ocurra en el disco espejado resultaría en pérdida de datos. El RAID 10 es a menudo la mejor elección para bases de datos de altas prestaciones, debido a que la ausencia de cálculos de paridad proporciona mayor velocidad de escritura.
  • 18. El RAID 30 o división con conjunto de paridad dedicado es una combinación de un RAID 3 y un RAID 0. El RAID 30 proporciona tasas de transferencia elevadas combinadas con una alta fiabilidad a cambio de un coste de implementación muy alto. La mejor forma de construir un RAID 30 es combinar dos conjuntos RAID 3 con los datos divididos en ambos conjuntos. El RAID 30 trocea los datos en bloque más pequeños y los divide en cada conjunto RAID 3, que a su vez lo divide en trozos aún menores, calcula la paridad aplicando un XOR a cada uno y los escriben en todos los discos del conjunto salvo en uno, donde se almacena la información de paridad.
  • 19. Un RAID 100, a veces llamado también RAID 10+0, es una división de conjuntos RAID 10. El RAID 100 es un ejemplo de RAID cuadriculado, un RAID en el que conjuntos divididos son a su vez divididos conjuntamente de nuevo. Todos los discos menos unos podrían fallar en cada RAID 1 sin perder datos. Sin embargo, el disco restante de un RAID 1 se convierte así en un punto único de fallo para el conjunto degradado. A menudo el nivel superior de división se hace por software. Los principales beneficios de un RAID 100 (y de los RAIDs cuadriculados en general) sobre un único nivel RAID son mejor rendimiento para lecturas aleatorias y la mitigación de los puntos calientes de riesgo en el conjunto. Es la mejor elección para bases de datos muy grandes, donde el conjunto software subyacente limita la cantidad de discos físicos permitidos en cada conjunto estándar. Implementar niveles RAID anidados permite eliminar virtualmente el límite de unidades físicas en un único volumen lógico.
  • 20. Un RAID 10+1, es un reflejo de dos RAID 10. Se utiliza en la llamados Network RAID que aceptan algunas cabinas de datos. Es un sistema de alta disponibilidad por red, lo que permite la replicación de datos entre cabinas a nivel de RAID, con lo cual se simplifica ampliamente la gestión de replicación de cabinas. El RAID 10+1, tratándose de espejos de RAID10 que tienen una gran velocidad de acceso, hace que el rendimiento sea muy aceptable, siempre y cuando se respete el requerimiento de 2ms de latencia como máximo.
  • 21. Aunque todas las implementaciones de RAID difieren en algún grado de la especificación idealizada, algunas compañías han desarrollado implementaciones RAID completamente propietarias que difieren sustancialmente de todas las demás.
  • 22. Himperia utiliza el RAID 50EE en el ZStore 3212L. Se trata de un RAID 0 de dos pools, cada uno de ellos con RAID 5EE (7+1+1). Tolera el fallo simultáneo de dos discos, y hasta 4 discos no simultáneos. El tiempo de reconstrucción se reduce al mínimo, gracias al RAID 5EE. Y se mejora el rendimiento gracias al RAID 0.
  • 23. La paridad doble, a veces implementada y conocida como paridad diagonal es similar al RAID 6, hay dos conjuntos de información de chequeo de paridad, pero a diferencia de aquél, el segundo conjunto no es otro conjunto de puntos calculado sobre un síndrome polinomial diferente para los mismos grupos de bloques de datos, sino que se calcula la paridad extra a partir de un grupo diferente de bloques de datos. Por ejemplo, sobre el gráfico tanto el RAID 5 como el RAID 6 calcularían la paridad sobre todos los bloques de la letra A para generar uno o dos bloques de paridad. Sin embargo, es bastante fácil calcular la paridad contra múltiples grupos de bloques, en lugar de sólo sobre los bloques de la letra A: puede calcularse la paridad sobre los bloques de la letra A y un grupo permutado de bloques. No es recomendable que el sistema de paridad doble funcione en modo degradado debido a su bajo rendimiento.
  • 24. RAID 1.5 es un nivel RAID propietario de HighPoint a veces llamado erróneamente RAID 15. Por la poca información disponible, parece ser una implementación correcta de un RAID 1. Cuando se lee, los datos se recuperan de ambos discos simultáneamente y la mayoría del trabajo se hace en hardware en lugar de en el controlador software.
  • 25. El RAID 7, este tipo incluye un sistema operativo incrustado de tiempo real como controlador, haciendo las operaciones de caché a través de un bus de alta velocidad y otras características de un ordenador sencillo. Todas las transferencias son asíncronas. Y las E/S están centralizadas por la caché. Se necesita un disco de paridad exclusivo. El agente SNMP permite su administración remota. Es una marca registrada de Storage Computer Corporation Aplicaciones: Sistemas de Tiempo Real (Industriales).
  • 26. RAID S es un sistema RAID de paridad distribuida propietario de EMC Corporation usado en sus sistemas de almacenamiento Symmetrix. Cada volumen reside en un único disco físico, y se combinan arbitrariamente varios volúmenes para el cálculo de paridad. EMC llamaba originalmente a esta característica RAID S y luego la rebautizó RAID de paridad (Parity RAID) para su plataforma Symmetrix DMX. EMC ofrece también actualmente un RAID 5 estándar para el Symmetrix DMX.
  • 27. Matrix RAID o matriz RAID es una característica que apareció por vez primera en la BIOS RAID Intel ICH6R, mas no es un nuevo nivel RAID. El Matrix RAID utiliza dos o más discos físicos, asignando partes de idéntico tamaño de cada uno de ellos diferentes niveles de RAID. Este producto está dirigido a los usuarios domésticos, proporcionando una zona segura (la sección RAID 1) para documentos y otros archivos que se desean almacenar redundantemente y una zona más rápida (la sección RAID 0) para el sistema operativo, aplicaciones, etcétera.
  • 28. La controladora RAID software del kernel de Linux (llamada md, de multiple disk, „disco múltiple‟) puede ser usada para construir un conjunto RAID 1+0 clásico, pero también permite un único nivel RAID 10 con algunas extensiones interesantes. En particular, soporta un espejado de k bloques en n unidades cuando k no es divisible por n. Esto se hace repitiendo cada bloque k veces al escribirlo en un conjunto RAID 0 subyacente de n unidades. Evidentemente esto equivale a la configuración RAID 10 estándar. Linux también permite crear otras configuraciones RAID usando la controladora md (niveles 0, 1, 4, 5 y 6) además de otros usos no RAID como almacenamiento multiruta y LVM2.
  • 29. La serie de adaptadores IBM ServeRAID soportan un espejado doble de un número arbitrario de discos, como se ilustra en el gráfico. Esta configuración es tolerante a fallos de unidades no adyacentes. Otros sistemas de almacenamiento como el StorEdge T3 de Sun soportan también este modo.
  • 30. El sistema de archivos ZFS de Sun Microsystems implementa un esquema de redundancia integrado parecido al RAID 5 que se denomina RAID Z. Esta configuración evita el “agujero de escritura” del RAID 5 y la necesidad de la secuencia leer-modificar-escribir para operaciones de escrituras pequeñas efectuando sólo escrituras de divisiones (stripes) completas, espejando los bloques pequeños en lugar de protegerlos con el cálculo de paridad, lo que resulta posible gracias a que el sistema de archivos conoce la estructura de almacenamiento subyacente y puede gestionar el espacio adicional cuando lo necesita.