Prueba tu recuperación ante desastres: el simulacro que casi nadie hace

Q: ¿Cada cuánto debo probar mi plan de recuperación ante desastres?

Como referencia, una prueba de restauración completa al menos una o dos veces al año, y comprobaciones más ligeras (restaurar un fichero o una base de datos concreta) con periodicidad mensual o trimestral. Además, conviene volver a probar siempre que cambie algo importante: una migración, un nuevo servidor, una actualización relevante o un cambio en las aplicaciones críticas. La frecuencia ideal depende de tu tolerancia a la pérdida de datos y de la parada, no de una cifra fija.

Q: ¿Qué diferencia hay entre RTO y RPO?

El RTO (Recovery Time Objective) es el tiempo máximo que puedes permitirte estar parado hasta volver a operar. El RPO (Recovery Point Objective) es la cantidad máxima de datos que puedes permitirte perder, medida en tiempo: si haces copia cada 24 horas, tu RPO es de hasta 24 horas. Ambos son objetivos que fijas según el negocio; la prueba de recuperación sirve para comprobar si tu sistema real los cumple de verdad.

Q: ¿Un backup que se completa sin errores garantiza que podré recuperar?

No. Que la copia termine con un 'correcto' solo indica que el proceso de copia se ejecutó, no que los datos sean íntegros ni que la restauración vaya a funcionar. Las copias pueden estar corruptas, incompletas o dejar fuera datos críticos, y muchas veces eso solo se descubre al intentar restaurar. Por eso un backup sin probar no es realmente un backup: hasta que no lo restauras, es una suposición.

Q: ¿Qué es una prueba tabletop de recuperación?

Es un simulacro sobre el papel: el equipo se reúne y recorre paso a paso qué haría ante un incidente concreto (por ejemplo un ransomware o la caída de un servidor), sin tocar los sistemas reales. Sirve para detectar huecos en el plan, responsabilidades poco claras o dependencias olvidadas antes de una prueba real. Es barata y de bajo riesgo, pero no sustituye a una restauración real: complementa, no reemplaza.

Q: ¿Puedo probar la recuperación sin afectar a la producción?

Sí. La forma habitual es restaurar en un entorno aislado (una máquina o red separada) donde compruebas que los datos vuelven íntegros y que las aplicaciones arrancan, sin tocar los sistemas en uso. Así verificas de verdad la copia y mides los tiempos reales de recuperación sin riesgo para la operativa diaria. Es la manera recomendable de hacer el simulacro con regularidad.

Probar tu recuperación ante desastres significa restaurar de verdad tus datos y sistemas en un entorno controlado para comprobar que funciona antes de que ocurra el incidente real. No basta con que la copia de seguridad se complete cada noche: hay que verificar que esos datos vuelven íntegros, que las aplicaciones arrancan y que lo consigues dentro del tiempo que tu negocio puede aguantar parado. Es un simulacro sencillo de plantear y, sin embargo, es el paso que casi nadie da. La mayoría de las empresas descubre si su copia servía justo en el peor momento: cuando ya la necesitan y no hay marcha atrás.

En este artículo te contamos por qué merece la pena hacer ese simulacro, qué tipos de prueba existen, cómo verificar de verdad tus objetivos de tiempo y de datos, y con qué frecuencia repetirlo. Sin tecnicismos innecesarios, pensado para que un responsable de empresa entienda qué preguntar y qué exigir.

Por qué probar el plan de recuperación

Un plan de recuperación ante desastres (DRP, por sus siglas en inglés) es el conjunto de decisiones y procedimientos que te permiten volver a operar tras un incidente grave: un ransomware, un fallo de hardware, un borrado accidental, una inundación o un corte prolongado. El problema es que la mayoría de estos planes viven en un documento y nunca se ponen a prueba. Y un plan que no se ha probado es, en la práctica, una hipótesis.

Probarlo tiene un valor muy concreto: convierte suposiciones en certezas. Al ejecutar el simulacro descubres si la copia se restaura realmente, si falta algún dato crítico que nadie estaba copiando, si el procedimiento está claro para quien tendría que ejecutarlo un domingo por la noche, y cuánto se tarda de verdad en volver. Casi siempre aparecen sorpresas: una base de datos que no entraba en el backup, una contraseña que solo conocía una persona, un servidor que dependía de otro que también había caído. Mejor encontrarlas en un ensayo que en una crisis.

La idea de fondo: un backup sin probar no es un backup, es una promesa. Hasta que no restauras esos datos y ves las aplicaciones funcionando, solo tienes la esperanza de que la copia sirva. Y la esperanza no es una estrategia de continuidad.

Tipos de prueba de recuperación

No todas las pruebas son iguales ni exigen el mismo esfuerzo. Lo sensato es combinar varias según lo que quieras verificar y el riesgo que estés dispuesto a asumir. Estas son las más habituales:

Prueba de escritorio (tabletop): el equipo se reúne y recorre paso a paso qué haría ante un escenario concreto —por ejemplo, «un ransomware cifra el servidor principal un viernes por la tarde»— sin tocar los sistemas. Es barata, rápida y de bajo riesgo. Sirve para detectar huecos en el plan, responsabilidades poco claras y dependencias olvidadas. No verifica nada técnico, pero ordena las ideas antes de la prueba real.
Restauración parcial: recuperas un fichero, una carpeta o una base de datos concreta desde la copia y compruebas que vuelve íntegra. Es ligera, se puede hacer con frecuencia y da una señal muy valiosa: que la copia contiene lo que debe y se puede leer.
Restauración real completa: reconstruyes un sistema entero (o varios) a partir de las copias, normalmente en un entorno aislado que no afecta a producción. Es la prueba de fuego: confirma que puedes levantar el servicio de cero, mide los tiempos reales y valida que las aplicaciones arrancan y se comunican entre sí.
Simulacro de conmutación (failover): si cuentas con un sistema de réplica o un entorno secundario, consiste en pasar la operativa a ese entorno alternativo y comprobar que el negocio sigue funcionando. Es el nivel más exigente y el que más se acerca a un desastre real.

La combinación recomendable para la mayoría de las pymes es sencilla: tabletop de vez en cuando para revisar el plan, restauraciones parciales frecuentes y, al menos una o dos veces al año, una restauración completa en un entorno de prueba. Con eso cubres casi todo el riesgo con un esfuerzo razonable.

RTO y RPO: los números que hay que verificar

Cualquier conversación seria sobre recuperación gira en torno a dos objetivos. Merece la pena entenderlos bien porque son el criterio con el que se mide si una prueba ha ido bien:

RTO (Recovery Time Objective): el tiempo máximo que tu empresa puede permitirse estar parada hasta volver a operar. Si tu RTO es de cuatro horas, todo el proceso de recuperación debería caber en esas cuatro horas.
RPO (Recovery Point Objective): la cantidad máxima de datos que puedes permitirte perder, medida en tiempo. Si haces copia una vez al día, tu RPO real es de hasta 24 horas: en el peor caso, perderías el trabajo de una jornada.

Aquí está el punto clave: el RTO y el RPO que apuntas en el papel no valen nada hasta que la prueba los confirma. Muchas empresas creen que se recuperan «en un par de horas» y, al hacer el simulacro, descubren que tardan un día entero porque nadie había cronometrado el proceso completo (localizar la copia, restaurarla, reconfigurar el servidor, validar los datos, reconectar a los usuarios). La prueba es lo que transforma un objetivo deseado en un tiempo real y medido. Si el resultado no cumple lo que el negocio necesita, entonces tienes una decisión que tomar: invertir en una solución más rápida o ajustar las expectativas. Ambas cosas son mucho mejor que enterarte durante la crisis.

Con qué frecuencia hacer el simulacro

No hay una cifra mágica válida para todos, pero sí una lógica clara. La frecuencia depende de cuánto duele para tu negocio perder datos o estar parado: cuanto más crítico sea un sistema, más a menudo conviene probarlo. Como orientación práctica:

Restauración completa: al menos una o dos veces al año.
Restauraciones parciales: mensual o trimestralmente, según la criticidad de los datos.
Tras cualquier cambio importante: una migración, un servidor nuevo, una actualización relevante o un cambio en las aplicaciones críticas. Cada cambio puede romper, sin avisar, lo que antes funcionaba.

Y una recomendación transversal: documenta cada prueba. Anota qué probaste, cuánto tardaste, qué falló y qué corregiste. Ese registro es lo que convierte el simulacro en mejora continua, y es también lo que te pedirá una auditoría o una póliza de ciberseguro si algún día toca demostrar que tu continuidad estaba bajo control.

Convierte la prueba en una rutina, no en un heroísmo

Probar la recuperación no debería depender de que a alguien se le ocurra un día que hace tiempo que no se comprueba. Lo eficaz es integrarlo en la operación: copias que se verifican de forma automática, restauraciones de prueba programadas y una monitorización con alertas que avise cuando una copia falla o cuando un backup lleva demasiado tiempo sin completarse. Detectar hoy que la copia de un servidor lleva una semana sin ejecutarse es infinitamente mejor que descubrirlo el día del incidente.

En 3L Systems ayudamos a diseñar y, sobre todo, a probar planes de continuidad reales. No se trata de vender más copias, sino de asegurar que las que ya tienes sirven de verdad: verificamos la integridad, medimos los tiempos, ensayamos la restauración en entornos aislados y documentamos el resultado. Puedes ver el enfoque completo en nuestra página de recuperación ante desastres. Cada empresa tiene una tolerancia distinta a la parada y a la pérdida de datos, así que el plan adecuado no sale de una plantilla: sale de analizar tu caso. Por honestidad, conviene decirlo claro: montar y probar bien la continuidad requiere método y acompañamiento profesional, pero es una de las inversiones que más tranquilidad da por lo que cuesta.

Si este tema te interesa, quizá también quieras leer sobre qué es Business Central y cómo un sistema de gestión centralizado facilita proteger y recuperar la información crítica del negocio.

Preguntas frecuentes

¿Cada cuánto debo probar mi plan de recuperación ante desastres?

Como referencia, una restauración completa al menos una o dos veces al año y comprobaciones más ligeras (restaurar un fichero o una base de datos) con periodicidad mensual o trimestral. Además, conviene volver a probar siempre que cambie algo importante: una migración, un servidor nuevo o una actualización relevante. La frecuencia ideal depende de tu tolerancia a la parada y a la pérdida de datos, no de una cifra fija.

¿Qué diferencia hay entre RTO y RPO?

El RTO es el tiempo máximo que puedes estar parado hasta volver a operar. El RPO es la cantidad máxima de datos que puedes permitirte perder, medida en tiempo: si copias cada 24 horas, tu RPO es de hasta 24 horas. Ambos son objetivos que fijas según el negocio; la prueba de recuperación sirve para comprobar si tu sistema real los cumple de verdad.

¿Un backup que se completa sin errores garantiza que podré recuperar?

No. Que la copia termine con un «correcto» solo indica que el proceso se ejecutó, no que los datos sean íntegros ni que la restauración vaya a funcionar. Las copias pueden estar corruptas, incompletas o dejar fuera datos críticos, y a menudo eso solo se descubre al intentar restaurar. Por eso un backup sin probar no es realmente un backup.

¿Qué es una prueba tabletop de recuperación?

Es un simulacro sobre el papel: el equipo recorre paso a paso qué haría ante un incidente concreto, sin tocar los sistemas reales. Sirve para detectar huecos en el plan, responsabilidades poco claras o dependencias olvidadas antes de una prueba real. Es barata y de bajo riesgo, pero complementa a una restauración real, no la sustituye.

¿Puedo probar la recuperación sin afectar a la producción?

Sí. Lo habitual es restaurar en un entorno aislado (una máquina o red separada) donde compruebas que los datos vuelven íntegros y que las aplicaciones arrancan, sin tocar los sistemas en uso. Así verificas la copia y mides los tiempos reales de recuperación sin riesgo para la operativa diaria.