Estoy buscando una alternativa de alta disponibilidad y tolerante a fallas para NFS: un sistema de archivos que puede manejar petabytes de datos y montarse simultáneamente en cientos de servidores Linux, al tiempo que ofrece failover automático y duplicación de datos. ¿Alguien puede sugerir una solución que satisfaga mis necesidades?

Con una mayor demanda de infraestructuras confiables y de alto rendimiento diseñadas para servir a sistemas críticos, los términos escalabilidad y alta disponibilidad no podrían ser más populares. Si bien manejar una mayor carga del sistema es una preocupación común, la disminución del tiempo de inactividad y la eliminación de puntos únicos de falla son igual de importantes. La alta disponibilidad es una calidad de diseño de infraestructura a escala que aborda estas últimas consideraciones.

En esta guía, discutiremos qué significa exactamente alta disponibilidad y cómo puede mejorar la confiabilidad de su infraestructura.

¿Qué es la alta disponibilidad?

En informática, el término disponibilidad se utiliza para describir el período de tiempo en que un servicio está disponible, así como el tiempo requerido por un sistema para responder a una solicitud realizada por un usuario. La alta disponibilidad es la calidad de un sistema o componente que asegura un alto nivel de rendimiento operativo durante un período de tiempo determinado.

Disponibilidad de medición

La disponibilidad a menudo se expresa como un porcentaje que indica cuánto tiempo de actividad se espera de un sistema o componente en particular en un período de tiempo determinado, donde un valor del 100% indicaría que el sistema nunca falla. Por ejemplo, un sistema que garantiza el 99% de disponibilidad en un período de un año puede tener hasta 3,65 días de tiempo de inactividad (1%).

Estos valores se calculan en función de varios factores, incluidos los períodos de mantenimiento programados y no programados, así como el tiempo para recuperarse de una posible falla del sistema.

¿Cómo funciona la alta disponibilidad?

La alta disponibilidad funciona como un mecanismo de respuesta a fallas para la infraestructura. La forma en que funciona es bastante simple conceptualmente, pero generalmente requiere un software y configuración especializados.

¿Cuándo es importante la alta disponibilidad?

Al configurar sistemas de producción robustos, minimizar el tiempo de inactividad y las interrupciones del servicio es a menudo una alta prioridad. Independientemente de cuán confiables sean sus sistemas y software, pueden ocurrir problemas que pueden derribar sus aplicaciones o sus servidores.

La implementación de alta disponibilidad para su infraestructura es una estrategia útil para reducir el impacto de este tipo de eventos. Los sistemas de alta disponibilidad pueden recuperarse de la falla del servidor o componente automáticamente.

¿Qué hace que un sistema esté altamente disponible?

Uno de los objetivos de alta disponibilidad es eliminar puntos únicos de falla en su infraestructura. Un único punto de falla es un componente de su pila de tecnología que causaría una interrupción del servicio si no estuviera disponible. Como tal, cualquier componente que sea un requisito para la funcionalidad adecuada de su aplicación que no tenga redundancia se considera un único punto de falla.

No estoy seguro acerca de los petabytes, pero ¿por qué no preguntarle a Joyent con su nube basada en ZFS?