Sé que puedo usar dos discos duros para RAID 0. ¿Pero hay una forma de incursión en la que la eliminación de datos se divide en 3 discos o 4 discos o más?

Las respuestas anteriores explican bien los detalles, así que solo te daré algunos diagramas para ayudarte a visualizar las diferencias.
Las imágenes y el contenido de esta respuesta se copian y pegan aquí y aquí.

RAID nivel 5

RAID 5 es el nivel de RAID seguro más común. Requiere al menos 3 unidades, pero puede funcionar con hasta 16. Los bloques de datos se reparten entre las unidades y en una unidad se escribe una suma de verificación de paridad de todos los datos del bloque. Los datos de paridad no se escriben en una unidad fija, se distribuyen en todas las unidades, como muestra el siguiente dibujo. Usando los datos de paridad, la computadora puede recalcular los datos de uno de los otros bloques de datos, en caso de que esos datos ya no estén disponibles. Eso significa que una matriz RAID 5 puede soportar un solo fallo de unidad sin perder datos o acceso a los datos. Aunque RAID 5 se puede lograr en software, se recomienda un controlador de hardware. A menudo, se utiliza memoria caché adicional en estos controladores para mejorar el rendimiento de escritura.

Ventajas

  • Las transacciones de lectura de datos son muy rápidas, mientras que las transacciones de escritura de datos son algo más lentas (debido a la paridad que debe calcularse).
  • Si falla una unidad, aún tiene acceso a todos los datos, incluso mientras se reemplaza la unidad fallida y el controlador de almacenamiento reconstruye los datos en la nueva unidad.

Desventajas

  • Las fallas de la unidad tienen un efecto en el rendimiento, aunque esto todavía es aceptable.
  • Esta es una tecnología compleja. Si uno de los discos en una matriz que usa discos de 4TB falla y se reemplaza, la restauración de los datos (el tiempo de reconstrucción) puede demorar un día o más, dependiendo de la carga en la matriz y la velocidad del controlador. Si otro disco falla durante ese tiempo, los datos se pierden para siempre.

Uso ideal

RAID 5 es un buen sistema completo que combina un almacenamiento eficiente con una excelente seguridad y un rendimiento decente. Es ideal para servidores de archivos y aplicaciones que tienen un número limitado de unidades de datos.

Nivel RAID 6 – Franja con doble paridad

RAID 6 es como RAID 5, pero los datos de paridad se escriben en dos unidades. Eso significa que requiere al menos 4 unidades y puede soportar 2 unidades que mueren simultáneamente. Las posibilidades de que dos unidades se rompan exactamente en el mismo momento son, por supuesto, muy pequeñas. Sin embargo, si una unidad en un sistema RAID 5 muere y se reemplaza por una nueva, la reconstrucción de la unidad en cuestión demora horas. Si otra unidad muere durante ese tiempo, aún perderá todos sus datos. Con RAID 6, la matriz RAID incluso sobrevivirá a esa segunda falla.

Ventajas

  • Al igual que con RAID 5, las transacciones de lectura de datos son muy rápidas.
  • Si fallan dos unidades, aún tiene acceso a todos los datos, incluso mientras se reemplazan las unidades fallidas. Entonces RAID 6 es más seguro que RAID 5.

Desventajas

  • Las transacciones de escritura de datos se ralentizan debido a la paridad que debe calcularse.
  • Las fallas de la unidad tienen un efecto en el rendimiento, aunque esto todavía es aceptable.
  • Esta es una tecnología compleja. La reconstrucción de una matriz en la que falló una unidad puede llevar mucho tiempo.

Uso ideal

RAID 6 es un buen sistema completo que combina un almacenamiento eficiente con una excelente seguridad y un rendimiento decente. Es preferible a RAID 5 en servidores de archivos y aplicaciones que usan muchas unidades grandes para el almacenamiento de datos.

Ben: Solo una nota, RAID 1 + 0 también se llama RAID 10, pero esto es diferente a
RAID 0 + 1 (también llamado RAID 01).

Nivel RAID 10: combina RAID 1 y RAID 0

Es posible combinar las ventajas (y desventajas) de RAID 0 y RAID 1 en un solo sistema. Esta es una configuración RAID anidada o híbrida. Proporciona seguridad al reflejar todos los datos en unidades secundarias mientras se usan bandas en cada conjunto de unidades para acelerar las transferencias de datos.

Ventajas

  • Si algo sale mal con uno de los discos en una configuración RAID 10, el tiempo de reconstrucción es muy rápido ya que todo lo que se necesita es copiar todos los datos del espejo sobreviviente a una nueva unidad. Esto puede tomar tan poco como 30 minutos para unidades de 1 TB.

Desventajas

  • La mitad de la capacidad de almacenamiento se destina a la duplicación, por lo que, en comparación con las grandes matrices RAID 5 o RAID 6, esta es una forma costosa de tener redundancia.

RAID 0 + 1 (también llamado también RAID 01)

Esto es diferente a RAID 1 + 0 (también llamado RAID 10)

  • RAID 01 también se llama RAID 0 + 1
  • También se le llama como “espejo de rayas”
  • Requiere un mínimo de 3 discos. Pero en la mayoría de los casos esto se implementará como mínimo de 4 discos.
  • Para entender esto mejor, cree dos grupos. Por ejemplo, si tiene un total de 6 discos, cree dos grupos con 3 discos cada uno, como se muestra a continuación. En el ejemplo anterior, el Grupo 1 tiene 3 discos y el Grupo 2 tiene 3 discos.
  • Dentro del grupo, los datos están rayados. es decir, en el Grupo 1 que contiene tres discos, el primer bloque se escribirá en el primer disco, el segundo bloque en el segundo disco y el tercer bloque en el tercer disco. Entonces, el bloque A se escribe en el Disco 1, el bloque B en el Disco 2, el bloque C en el Disco 3.
  • En todo el grupo, los datos se reflejan. es decir, el Grupo 1 y el Grupo 2 se verán exactamente iguales. es decir, el disco 1 se refleja en el disco 4, el disco 2 en el disco 5, el disco 3 en el disco 6.
  • Es por eso que se llama “espejo de rayas”. es decir, los discos dentro de los grupos están rayados. Pero, los grupos se reflejan.

Diferencia principal entre RAID 10 vs RAID 01

  • El rendimiento en RAID 10 y RAID 01 será el mismo.
  • La capacidad de almacenamiento en estos será la misma.
  • La principal diferencia es el nivel de tolerancia a fallas. En la mayoría de las implementaciones de controladores RAID, la tolerancia a fallos RAID 01 es menor. En RAID 01, dado que solo tenemos dos grupos de RAID 0, si fallan dos unidades (una en cada grupo), fallará todo el RAID 01. En el diagrama RAID 01 anterior, si el Disco 1 y el Disco 4 fallan, ambos grupos estarán inactivos. Entonces, todo el RAID 01 fallará.
  • La tolerancia a fallos RAID 10 es más. En RAID 10, dado que hay muchos grupos (ya que el grupo individual es solo dos discos), incluso si fallan tres discos (uno en cada grupo), el RAID 10 sigue siendo funcional. En el ejemplo de RAID 10 anterior, incluso si falla el Disco 1, Disco 3, Disco 5, el RAID 10 seguirá funcionando.
  • Entonces, dada la opción entre RAID 10 y RAID 01, siempre elija RAID 10.

Como Simon mencionó, el número de RAID se refiere a la estrategia específica de varios discos que se está utilizando (en este caso, el trazado de bandas) y el nivel de redundancia / tolerancia a fallas que ofrece. Sin embargo, no es necesario que una implementación RAID 0 consista solo en dos discos: puede dividir en 3, 4 o incluso 10 o 20 discos si su controlador lo admite.

La razón principal por la que las personas generalmente no colocan más de dos discos en una matriz RAID 0 es que cualquier falla en el disco derribaría toda la matriz, ya que no hay redundancia. Suponiendo que todos los discos son del mismo tamaño, el 100% de su espacio combinado se usa para datos, por lo que no hay copia de seguridad en la matriz. El principal beneficio de RAID 0 está en la velocidad: las lecturas y escrituras pueden ser más rápidas debido a la división de datos, pero como mencioné, si un solo disco se cae, se dispara toda la matriz. Por lo tanto, cuantos más discos tenga en la matriz, mayores serán las posibilidades de que uno de ellos falle aleatoriamente y más datos perderá en el proceso.

RAID 1 es esencialmente lo contrario: cada disco es una réplica exacta entre sí (reflejo). En este caso, si tiene dos discos, solo tiene el espacio de almacenamiento de un disco, pero si uno de los discos se cae, el otro puede hacerse cargo de inmediato y sus datos se conservan. Los discos adicionales en la matriz aumentan aún más esta redundancia, pero la eficiencia general del almacenamiento disminuye. RAID 1 también generalmente acelera las operaciones de lectura, aunque las escrituras generalmente demorarán tanto como lo harían en un solo disco.

Algunas personas usan “RAID 0 + 1”, donde una configuración típica tiene cuatro discos divididos en pares, donde cada par es una matriz RAID 0 (rayada) y los dos pares son espejos entre sí. Esto proporciona mejoras de velocidad y redundancia a un costo más alto que cualquiera de las dos soluciones individualmente. También es posible la configuración opuesta (RAID 1 + 0, a veces llamada RAID 10), donde cada par de discos está reflejado y los propios espejos están rayados a través de los pares. Esto puede proporcionar mejoras similares de velocidad y redundancia, pero es una solución técnicamente más compleja.

La solución de “compromiso” más común es RAID 5, que requiere un mínimo de 3 discos. En esta configuración, todos los discos menos uno tienen datos divididos como RAID 0, pero el disco restante consta de datos de “paridad”, que proporcionan un medio para reconstruir la matriz si uno de los discos principales se cae. Básicamente, si el disco 1 muere, la matriz entra en “modo crítico” y las operaciones de lectura utilizan los datos reales del disco 2 y los datos de paridad del disco 3 para reconstruir los datos originales. Esto ralentiza drásticamente la matriz, pero le permite recuperarse, y cuando se reemplaza el disco fallido, la matriz se puede reconstruir para que el nuevo disco 1 tenga el mismo contenido que el disco original 1 (más lo que haya cambiado desde entonces). Si el disco de paridad se cae, la matriz todavía está en modo crítico, pero efectivamente es una matriz RAID 0 hasta que se reemplaza el disco de paridad, y la reconstrucción vuelve a llenar la información de paridad.

Cada una de estas soluciones tiene diferentes niveles de rendimiento, redundancia y factores de costo, por lo que deberá sopesarlos para determinar qué solución se adapta mejor a sus necesidades. Por ejemplo, los servidores que necesitan ser rápidos y que también son básicamente prescindibles (por ejemplo, nodos de lectura en una base de datos grande) a menudo tienen matrices RAID 0 para maximizar la velocidad de los datos, al tiempo que reconocen que pueden intercambiarse con frecuencia. Por otro lado, un servidor de almacenamiento duradero, donde la integridad de los datos es el factor más importante, puede optar por una solución RAID 1 o RAID 5.

El nivel RAID describe el nivel de redundancia, o capacidad de recuperación de los datos.

Para RAID 0, no hay redundancia, la pérdida de cualquier disco provoca la pérdida de todos los datos.

RAID 0 no está limitado a dos unidades: puede dividir tantas como tenga, sin embargo, sigue siendo RAID 0, ya que el 0 significa “sin posibilidad de recuperación”.

Niveles RAID estándar – Wikipedia

RAID 0 = sin redundancia

RAID 1 = copia completa en una (s) unidad (es) alternativa (s). Admite el fallo de cualquier número de unidades, siempre y cuando uno siga funcionando.

RAID 2 = franja de nivel de bits con unidades sincronizadas (rara vez, si alguna vez se usa): admite el fallo de cualquier unidad.

RAID 3 = franja de nivel de bytes con unidades sincronizadas (rara vez, si alguna vez se usa): admite el fallo de cualquier unidad

RAID 4 = franjas de nivel de bloque con paridad dedicada: admite la falla de una sola unidad

RAID 5 = franjas de nivel de bloque con paridad distribuida. RAID 5 requiere al menos 3 discos, pero solo se desperdicia 1 capacidad de disco, por lo que 10 discos de capacidad se pueden proteger con 11 discos bajo RAID5. Apoya la falla de cualquier unidad

RAID 6 = como RAID5 pero con dos franjas de paridad, admite fallas en cualquiera de las dos unidades.