Failover y failback: procesos clave en caso de desastre

5min

Los sistemas tecnológicos están sujetos a fallos e imprevistos que provocan la interrupción de servicios y la consiguiente incapacidad de continuar con la labor establecida. Estos errores suponen una importante merma para la productividad, y afectan a la confianza de los clientes en las empresas, a la productividad de estas últimas y, en definitiva, a los resultados de las compañías.

La dependencia de los negocios de las infraestructuras IT es cada vez mayor y resulta fundamental disponer de algún tipo de plan de recuperación ante desastres. Arsys, por ejemplo, ofrece a sus clientes una solución desarrollada con Veeam y que resulta accesible a todas las empresas, Cloud Connect Replication. Gracias a ella, y junto a otras cosas, es posible minimizar ese tiempo de inactividad del que hablábamos y contar con «un failover rápido y flexible y un failback optimizado».  ¿Te generan dudas algunos de estos conceptos esenciales en el mantenimiento de los sistemas de una empresa? Hoy te explicamos en qué consisten y en qué se diferencian un failover y un failback. 

Índice

¿Qué es un failover?

Aumentos inesperados del tráfico, ciberataques, catástrofes naturales o problemas con el sistema operativo pueden dejar fuera de servicio a todo un sistema informático. El failover es un proceso que habilita la entrada en producción de un entorno secundario diseñado para mantener la operativa IT en caso de desastres, evitando una parada de servicios prolongada en el tiempo.

En concreto, se trata de un modo de operar que está basado en la existencia y puesta en marcha de un entorno secundario que pueda reemplazar al principal cuando este no está disponible o no funciona. Estos errores pueden estar vinculados a diferentes elementos, fallo eléctrico, un servidor, la base de datos o la conectividad, por ejemplo. Puede darse la situación de tener que ejecutar failover parciales (por fallo de un solo elemento) o totales, en los escenarios más complejos.

Este entorno secundario ha de estar compuesto, pues, por más de dos nodos interconectados. En ellos se ejecutarán las máquinas virtuales. Además, demanda un almacenamiento compartido que conserva las copias de los archivos de las máquinas virtuales. Cuando se produce una interrupción de alguna parte del servicio, las máquinas virtuales se restablecen en el entorno secundario. La principal ventaja de un failover es que, cuando ocurre un error que afecte al funcionamiento, la restauración inmediata hace que el tiempo de inactividad de los servicios sea prácticamente nulo. 

¿Qué es un failback?

También conocido como conmutación por recuperación es otro punto clave en el proceso que permite volver a la normalidad en los servicios desde el failover. Después de la conmutación por error, el failback devuelve toda su producción al entorno original. ¿Cómo lo hace?

Este proceso implica la reintegración en la máquina original de las cargas de trabajo que, tras la incidencia, han permanecido en la réplica de la máquina virtual. Al sistema original llegarán aquellos datos que hayan sido modificados en la réplica. Es fundamental, eso sí, que se produzca una sincronización previa al failback entre esta última y la máquina original. 

Aspectos que han de tenerse en cuenta en un failover y un failback

Toda labor de recuperación ante desastres ha de tener en cuenta que las operaciones están vinculadas a datos sensibles y exigen trabajar con una transparencia absoluta respecto a la empresa propietaria y una especial sensibilidad con las medidas de protección. Partiendo de esa idea, es importante destacar algunos aspectos que deben estar muy presentes en el momento de llevar a cabo un failover y un failback. 

  • Establecer el equipo que desarrollará los procesos. Los profesionales encargados de enfrentarse a la recuperación de situaciones críticas deben estar claramente definidos para que cualquier proceso se pueda llevar a cabo de forma ágil. Todos ellos han de tener conocimientos específicos de las tecnologías. Además, las personas vinculadas con los sistemas deben ser formadas para poder identificar posibles errores y saber actuar cuando se produzcan.
  • Valorar la capacidad técnica para llevar a cabo el failover y failback. Comprobar que todo el entorno virtual está adaptado y tiene la capacidad para que se lleven a cabo los procesos. 
  • Acuerdos legales entre empresas y proveedores. Las condiciones de los contratos firmados entre las partes pueden tener matices que afecten al failover o failback. Tenlos en cuenta.
  • Hacer pruebas previas. Para garantizar la seguridad y eficacia del proceso, es importante implementar una metodología de pruebas que nos permitan probar previamente que todo funciona según las necesidades en caso de que se dé una situación de desastre.
  •  Identifica fortalezas y debilidades. El failover y failback forman parte del Plan de Recuperación de Desastres. Es importante medir la respuesta ante situaciones críticas para poder optimizar los procesos, potenciando lo que ha funcionado bien y mejorando aquello que se ha señalado como mejorable. 

Failover y failback suponen un respaldo necesario en el funcionamiento de cualquier organización. Tener la capacidad de reaccionar ante errores o problemas grave de los sistemas sin que se produzca una paralización de la actividad resulta esencial para mantener la productividad y conservar la confianza de los clientes.

Fernando Fuentes

Productos relacionados: