¿Qué es RAID-Z??

¿Qué es RAID-Z??
Los sistemas de archivos son más antiguos que UNIX. Y desde que comenzamos a digitalizar nuestras vidas en cintas, discos y SSDS, una amenaza ha sido eminente. Eso es de falla de hardware. Los datos almacenados en los discos a menudo son más caros que los discos en sí y estos datos necesitan toda la redundancia que podemos reunir.

RAID-Z es una de las mejores herramientas que garantizaría que sus datos vivan lo más libres de errores posible incluso en la colección más barata de discos. Es parte de OpenZFS. Puede entender los conceptos básicos de OpenZFS en este breve artículo si no ha oído hablar de él antes. Es un sistema de archivos de grado abierto, de grado empresarial disponible en Linux, FreeBSD, Mac OS X, Smartos, Illumos y otros OSS importantes.

Pero primero ... ¿Qué es la incursión??

RAID representa la variedad redundante de discos independientes (económicos). Esto se refiere a la práctica de la industria de almacenar datos no solo en un disco sino en múltiples discos, de modo que incluso cuando hay una falla en el disco, los datos pueden reconstruirse de otros discos. La forma en que los datos se extienden a través de los discos es diferente para diferentes tipos de despidos, en consecuencia, se llaman RAID 0, RAID 1, etc. No vamos a tratar con ellos aquí. Nos centraríamos en un Raidz que es específico de OpenZFS.

RAID (y también RAID-Z) no es lo mismo que escribir copias de datos en un disco de copia de seguridad. Cuando tiene dos o más discos configurados en RAID, los datos se les escriben simultáneamente y todos los discos están activos y en línea. Esta es la razón por la cual Raid es diferente de las copias de seguridad y, lo que es más importante, por qué Raid no es un sustituto de las copias de seguridad. Si todo su servidor se quema, entonces todos los discos en línea podrían ir con el servidor, pero las copias de seguridad le ahorrarán el día. Del mismo modo, si hay una falla de disco único y algo no estaba respaldado, porque no puede hacerlo todos los días, entonces RAID puede ayudarlo a recuperar esa información.

Las copias de seguridad se toman copias periódicamente de datos relevantes y la redada es una redundancia en tiempo real. Hay varias formas en que los datos se almacenan en los sistemas de redadas tradicionales, pero no entraremos en ellos aquí. Aquí, nos sumergiríamos profundamente en Raidz, que es una de las características más geniales de OpenZFS.

Una última cosa antes de comenzar, la redada tradicional a veces alienta al uso de dispositivos de hardware dedicados para hacer la redada. Esto deja que el sistema operativo y el sistema de archivos desconocen los mecanismos de redacción que están en su lugar. Pero a menudo la tarjeta RAID (el hardware dedicado) se encuentra con una falla que deja toda su matriz de disco esencialmente inútil.

Para evitar esto, Siempre debe intentar usar OpenZFS sin ningún controlador de hardware.

RAID-Z1, RAID-Z2, RAID-Z3

ZFS combina las tareas del administrador de volumen y los sistemas de archivos. Esto significa que puede especificar los nodos del dispositivo para sus discos mientras crea un nuevo grupo y ZFS los combinará en un grupo lógico y luego puede crear conjuntos de datos para diferentes usos como /home, /usr, etc. además de ese volumen.

Configurar RAID-Z requeriría al menos 3 o más discos. No puedes usar menos de tres discos. El proveedor de almacenamiento puede ser algo más también de almacenamiento adjunto de la red, dispositivo de bloque virtual, etc., pero nos mantengamos a tres discos de igualdad de tamaños como ejemplo simple.

Los tres discos se pueden combinar en un dispositivo virtual (VDEV). Este es el componente de construcción de un zpool. Si está comenzando con solo 3 discos, tiene 1 VDEV en su zpool. Puedes tener 2 VDEV con 6 discos, etc.

Supongamos que tiene un archivo de 1 GB que desea almacenar en esta piscina. RAID-Z lo divide en dos trozos iguales de 512 MB y luego realiza una operación matemática entre ellos que genera una tercera fragmentación de 512 MB (llamada bloque de paridad). Los tres trozos se escriben en tres VDEV separados. Entonces el archivo termina tomando 1.5 GB de espacio en total.

Sin embargo, la ventaja es que, si falla uno de los discos, digamos que el primer trozo se pierde, entonces el segundo fragmento y el bloque de paridad se pueden usar recrean el primero. Del mismo modo, si se pierde el segundo fragmento, el primero y el tercero se pueden usar para recrear el segundo.

Sus archivos usan un 50% más de espacio del necesario, pero puede soportar la falla de un disco por VDEV. Esto es RAID-Z1.

Pero una piscina ZFS puede crecer y eventualmente necesitará más espacio. Bueno, no puede agregar más discos directamente a un VDEV (esa característica se propone y podría estar en desarrollo en este momento). Sin embargo, puede agregar un VDEV. Esto significa que puede agregar discos en conjuntos de tres y tratar cada nuevo conjunto como un solo VDEV lógico.

Ahora puede tolerar una sola falla en el disco en este nuevo VDEV y una sola falla de disco en la más antigua. Pero si más de un disco fallan dentro de un solo VDEV, eso no es recuperable. Toda su piscina se vuelve inútil incluso los VDEV más saludables.

Este es un modelo realmente simplificado. Los archivos nunca se dividen exactamente en las mitades, pero los datos se tratan como bloques de longitudes fijas. Además, puede usar más de 3 discos (pero 3 es el mínimo) por VDEV y RAID-Z1 asegurará que cada bloque de datos único esté escrito de tal manera que pueda recuperarse de la falla de cualquier disco único en VDEV. Afortunadamente, no tiene que preocuparse por estos detalles internos. Esa es responsabilidad de ZFS. Una vez que el grupo está configurado, los datos se extienden automáticamente a través de él de la manera más óptima.

La tolerancia a la falla todavía se limita a una falla en el disco por VDEV. Para ir más allá de eso tenemos que ir a RAID-Z2. RAID-Z2 funciona de manera similar, pero crea dos bloques de paridad y dos bloques de datos de una sola información. Esto le permite resistir hasta 2 fallas en el disco por VDEV. También un VDEV debe tener al menos 4 discos si va a implementar una configuración RAID-Z2.

Del mismo modo, RAID-Z3 requiere al menos 5 discos por VDEV y puede resistir la falla de 3 de ellos. RAID-Z3 no es tan eficiente en el espacio como RAID-Z2, que no es tan eficiente en términos de espacio como RAID-Z1.

Conclusión

Con Raid-Z vemos una compensación entre el espacio utilizable que ofrece discos individuales y la confiabilidad que puede ofrecer la recolección de dichos discos. Con un mayor número de discos, la probabilidad de que los discos múltiples falle simultáneamente también aumentan.

La mejor manera de contrarrestarlo es utilizar una estrategia efectiva de RAID-Z que ofrece confiabilidad, así como la mejor explosión para su dinero. Háganos saber si encontró este tutorial útil o si tiene alguna pregunta con respecto a RAID-Z!