RPO y RTO son las dos métricas que transforman un discurso genérico de "queremos alta disponibilidad" en un contrato técnico claro. Determinan cuánto dato puedes perder, cuánto tiempo puedes estar caído y, por lo tanto, cuánto debes invertir en respaldo y recuperación.

En esta guía te enseñamos a definir RPO y RTO realistas, a calcular el costo del downtime y a traducirlos en decisiones de arquitectura concretas.

Contenido

  1. Definiciones precisas de RPO y RTO
  2. Diferencias clave y errores comunes
  3. Cómo calcular RPO y RTO en tu empresa
  4. Calcular el costo del downtime
  5. Cómo traducir RPO/RTO a arquitectura
  6. MTTR, MTBF y otras métricas relacionadas
  7. Preguntas frecuentes

Definiciones precisas de RPO y RTO

RPO (Recovery Point Objective)

Es la cantidad máxima de datos, medida en tiempo, que la empresa puede permitirse perder. Si tu RPO es 1 hora, tus respaldos deben capturar cambios al menos cada hora. Un incidente a las 15:00 con RPO de 1 h implica que aceptas perder los datos entre 14:00 y 15:00.

RTO (Recovery Time Objective)

Es el tiempo máximo aceptable desde que ocurre la caída hasta que el servicio está operativo nuevamente. Incluye detección, notificación, decisión, ejecución y validación. Si tu RTO es 4 h y el servicio cayó a las 10:00, debe estar funcional a las 14:00.

Regla mnemotécnica: RPO mira hacia atrás (¿cuánto puedo perder?). RTO mira hacia adelante (¿cuánto tardo en volver?).

Diferencias clave y errores comunes

AspectoRPORTO
UnidadTiempo de datos perdidosTiempo de recuperación
Determinado porFrecuencia de backup/replicaciónArquitectura de recuperación
Inversión principalAlmacenamiento, ancho de bandaCompute en standby, automatización
Impacto si se excedePérdida de datos (irrecuperables)Pérdida de facturación y reputación

Un error común es fijar RPO y RTO idénticos para todos los sistemas. Resulta carísimo e innecesario. Usa el BIA (ver guía de DRP) para clasificar sistemas en tiers.

Cómo calcular RPO y RTO en tu empresa

No se calculan en TI: se negocian con el negocio. El proceso:

  1. Entrevista con dueños de proceso: pregunta "si este sistema cayera ahora, ¿en cuánto tiempo te genera un daño irreversible?"
  2. Cuantifica el costo por hora: facturación perdida + multas + costo de personal parado + daño reputacional
  3. Evalúa dependencias: un ERP sin base de datos no sirve; RTO del ERP = max(RTO_app, RTO_db)
  4. Define tiers: agrupa sistemas con RPO/RTO similares
  5. Valida con CFO y Gerencia: los RTOs más agresivos requieren inversión que deben aprobar

Ejemplo: empresa retail chilena

SistemaRPORTOJustificación
E-commerce + pasarela pago5 min30 min$2M/hora de venta online
ERP / facturación SII15 min2 hObligación tributaria en curso
CRM comercial1 h4 hImpacto diferido
Intranet / RRHH4 h8 hProceso interno no crítico
Archivo histórico24 h48 hConsulta ocasional

Calcular el costo del downtime

Fórmula base:

Costo/hora = (Ingresos_diarios / Horas_operación) + (Salarios_hora_empleados_impactados × N_empleados) + Multas_contractuales_hora + Costo_reputacional_estimado

Un e-commerce con $100M/día de venta y 10 horas operativas pierde $10M/hora solo en ventas. Si el RTO es 4 horas, el incidente cuesta $40M. Una infraestructura de DR que costaría $3M/año se paga en un solo evento.

Estudio Gartner: el costo promedio del downtime en empresa mediana es USD 5.600/minuto. El rango real para PYMEs chilenas va de $50.000 a $1.500.000/hora según sector.

Cómo traducir RPO/RTO a arquitectura

RPO objetivoTecnología sugerida
24 hBackup diario con Veeam/Vembu
4-8 hBackup incremental frecuente
1 hSnapshot de storage + replicación async
5-15 minCDP (Continuous Data Protection)
0Replicación síncrona (stretched cluster)
RTO objetivoTecnología sugerida
24 h+Restore desde backup a hardware nuevo
4-8 hInstant Recovery de Veeam + cloud
1 hDRaaS con orquestación (Azure Site Recovery)
<15 minCluster activo-activo, load balancer geo-distribuido

Cuando la solución parece desproporcionada al costo, probablemente el RTO está sobre-especificado. Vuelve a la conversación de negocio. Nuestro servicio de Respaldo y Monitoreo construye estos diseños con soluciones apropiadas a cada tier.

MTTR, MTBF y otras métricas relacionadas

¿Definimos tus RPO y RTO con tu equipo?

Facilitamos BIAs, medimos MTTR reales y diseñamos arquitecturas de respaldo a la medida.

Hablar con UpTech →

Preguntas frecuentes

¿Qué significan RPO y RTO?

RPO (Recovery Point Objective) es la cantidad máxima de datos tolerable de perder. RTO (Recovery Time Objective) es el tiempo máximo aceptable de caída del servicio.

¿Cuál es un RTO típico para un ERP?

Entre 1 y 4 horas en empresas medianas. Sistemas críticos de gran empresa apuntan a <1 h con replicación síncrona y arquitectura activo-activo.

¿Cómo calculo el costo del downtime?

Suma facturación por hora perdida, costo de personal parado, multas contractuales y pérdida reputacional estimada. Para e-commerce y retail el cálculo es directo; para B2B suele requerir modelar impacto diferido.

¿RPO puede ser cero?

En teoría sí, con replicación síncrona. En la práctica tiene costos de latencia e infraestructura muy altos y normalmente se reserva para transacciones financieras críticas.

¿Cada cuánto reviso RPO y RTO?

Mínimo anual, o cuando cambian procesos críticos del negocio. Un RTO establecido en 2018 rara vez sigue siendo realista en 2025.