Un incendio, una inundación, un ataque de ransomware o una caída eléctrica prolongada pueden paralizar a tu empresa por días. Un Plan de Recuperación ante Desastres (DRP) bien diseñado determina si vuelves a operar en horas o si pierdes clientes y facturación por semanas.

En esta guía te explicamos paso a paso cómo construir un DRP profesional: desde el análisis de impacto al negocio hasta la redacción de los runbooks y las pruebas periódicas. Seguimos lineamientos de ISO 22301 y NIST SP 800-34.

Contenido

  1. Qué es un DRP y cómo se diferencia del BCP
  2. Análisis de Impacto al Negocio (BIA)
  3. Estrategias de recuperación: cold, warm, hot
  4. Sitios alternos y cloud DR
  5. Runbooks y procedimientos
  6. Pruebas, actualización y gobierno
  7. Errores típicos en DRPs
  8. Preguntas frecuentes

Qué es un DRP y cómo se diferencia del BCP

El DRP es el documento táctico que describe cómo restaurar la infraestructura TI (servidores, datos, redes, aplicaciones) tras una disrupción. Forma parte de un plan mayor llamado Business Continuity Plan (BCP), que cubre además personas, comunicación con clientes, proveedores, oficinas alternas y procesos manuales.

Piénsalo así: el BCP responde "¿cómo seguimos operando?" y el DRP responde "¿cómo volvemos a encender los sistemas?".

Análisis de Impacto al Negocio (BIA)

El BIA es el paso cero. Sin él, cualquier DRP es puro teatro. Consiste en levantar cada proceso crítico del negocio y determinar:

Profundizamos el cálculo en nuestra guía de RPO y RTO. El output del BIA es una matriz de priorización que guía todo lo demás.

Ejemplo de matriz BIA simplificada

ProcesoRTORPOCosto/hora caídaTier
ERP Facturación2 h15 min$2.500.000Tier 1
Sitio web e-commerce1 h5 min$1.800.000Tier 1
Correo corporativo4 h1 h$600.000Tier 2
File server8 h4 h$300.000Tier 2
CRM histórico24 h24 h$80.000Tier 3

Estrategias de recuperación: cold, warm, hot

Una vez priorizados los servicios, define la estrategia adecuada. No todo debe tener RTO de 1 hora.

TipoDescripciónRTO típicoCosto
Cold siteEspacio físico vacío, hardware a comprarDías$
Warm siteHardware listo, datos restaurados en evento4-24 h$$
Hot siteReplica síncrona, conmutación rápida<1 h$$$
DRaaS (cloud)Réplica a cloud con orquestación15 min - 4 h$$

Sitios alternos y cloud DR

En Chile, los DRP tradicionalmente usaban un segundo datacenter (por ejemplo Sonda, GTD, Entel). Hoy lo más común es cloud DR con Azure Site Recovery, AWS Elastic Disaster Recovery o Veeam Cloud Connect.

Ventajas del DR en cloud

Contexto Chile: Si tus datos están sujetos a la Ley 19.628 o a fiscalización de la CMF, valida residencia de datos. Proveedores como Azure (Santiago), AWS (futuro data center Chile) y datacenters locales permiten mantener datos dentro del país.

Runbooks y procedimientos

Un DRP sin runbooks es solo un PowerPoint. Los runbooks son procedimientos paso a paso que permiten a cualquier técnico ejecutar la recuperación bajo estrés.

Estructura mínima de un runbook

  1. Trigger: condiciones que activan el plan (ej: "caída >30 min del ERP principal")
  2. Declaración formal: quién autoriza activar el DRP
  3. Árbol de llamadas: lista de contactos y responsables
  4. Pasos técnicos: comandos, URLs, credenciales en vault
  5. Criterios de éxito: cómo validar que el servicio está operativo
  6. Comunicación a clientes: plantillas de mensaje
  7. Vuelta atrás (failback): cómo retomar el sitio principal
# Runbook: Failover ERP (Tier 1) # Autorizado por: CIO o Gerente TI # Tiempo estimado: 45 min · RTO comprometido: 2 h 1. Confirmar incidente en monitoring (Zabbix) 2. Notificar a stakeholders vía WhatsApp Business 3. En Azure Portal: Recovery Services Vault > Failover 4. Actualizar DNS (CNAME erp.empresa.cl) a IP de DR 5. Validar conexión desde 3 usuarios de prueba 6. Confirmar operación y registrar tiempos

Pruebas, actualización y gobierno

Un DRP es un organismo vivo. ISO 22301 exige pruebas al menos anuales; en la práctica recomendamos:

Asigna un DRP Coordinator con KPIs trimestrales. Sin dueño, el plan se pudre. Integra el monitoreo proactivo (ver nuestra guía de monitoreo proactivo) para detectar condiciones de activación temprano.

Errores típicos en DRPs

1. Documentos de 200 páginas que nadie lee

Un DRP operativo tiene máximo 20-30 páginas de cuerpo, con anexos técnicos separados. Si el documento no cabe en una reunión de 1 hora, se ignorará.

2. Credenciales guardadas en el mismo sistema caído

Si las claves del firewall de DR están en el file server que acaba de caer, tienes un problema circular. Usa un vault externo (1Password Business, Bitwarden, HashiCorp Vault) con copia impresa en caja fuerte.

3. No involucrar al negocio

TI no decide RTOs: el negocio sí. Un DRP técnicamente perfecto pero con RTO de 24 h cuando el CFO pierde $2M/hora es un fracaso en espera.

¿Diseñamos tu DRP junto a ti?

UpTech acompaña el ciclo completo: BIA, arquitectura, runbooks, pruebas y operación del sitio DR.

Hablar con UpTech →

Preguntas frecuentes

¿Qué diferencia hay entre DRP y BCP?

El BCP cubre la continuidad del negocio completo (personas, procesos, comunicación). El DRP es el subplan técnico que detalla cómo recuperar la infraestructura TI.

¿Cuánto cuesta implementar un DRP?

Un DRP básico en cloud para PYME parte desde USD 500/mes. Sitios warm o hot para empresas medianas pueden superar los USD 5.000/mes, pero el costo debe compararse contra el costo del downtime.

¿Con qué frecuencia debo probar el DRP?

ISO 22301 recomienda al menos una simulación anual con tabletop trimestrales. Sistemas Tier 1 deben ejercitarse al menos dos veces al año.

¿Un DRP necesita cloud?

No obligatoriamente, pero el cloud simplifica enormemente los sitios warm/hot y reduce costos de infraestructura ociosa. Para la mayoría de PYMEs chilenas el DRaaS es la mejor relación costo/beneficio.

¿El DRP aplica a SaaS como Microsoft 365?

Sí. Microsoft garantiza disponibilidad del servicio pero no protege contra eliminación accidental o ransomware en mailboxes. Incluye backup SaaS en tu DRP (Veeam for Microsoft 365, por ejemplo).