La continuidad de un negocio implica el diseño, la implementación y la ejecución de todas las aplicaciones que hoy en día sirven de operabilidad en las compañías bajo cualquier escenario de negocio, de manera que las mismas sean resistentes a los eventos de interrupción, planeados o no planeados, que provocan la pérdida permanente o temporal de la capacidad de cualquiera aplicación para realizar efectivamente su función empresarial. Entre los eventos no planeados se incluyen desde los errores humanos hasta las interrupciones permanentes o temporales, pasando por los desastres regionales que pueden provocar la pérdida a gran escala de la instalación en una determinada región de Azure. Los eventos planificados incluyen la reimplementación de la aplicación en una región diferente, la aplicación de actualizaciones de aplicaciones, etc. El objetivo de la continuidad del negocio es que su aplicación siga funcionando durante estos eventos con un impacto mínimo en la función empresarial que desempeña. En la presente sesión, estaré impartiendole de forma sencilla cuáles deberían ser las herramientas y sus respectivos tips para mantener en perfecto estado de ejecución, las bases de datos SQL Database en Azure de cualquier escalabilidad ante cualquier escenario de desastre.
4. Agenda
• Que es BCDR (Business Continuity / Disaster Recovery)
• BCDR para Azure SQL DB
• Tipos de BCDR para Azure SQL DB
5. Que es BCDR
(Business Continuity / Disaster Recovery)
• El eterno problema de la
continuidad de las empresas
• Computación en la nube
• BCDR para SQL Server On-Premise
6. El eterno problema de la continuidad de las
empresas
Habilitando las aplicaciones para su continua operatividad durante
eventos “disruptivos” planificados y no planificados.
7. Computación en la nube
Packaged
Software
Storage
Servers
Networking
O/S
Middleware
Virtualization
Data
Applications
Runtime
Youmanage
Infrastructure
(as a Service)
Storage
Servers
Networking
O/S
Middleware
Virtualization
Data
Applications
Runtime
Managedbyvendor
Youmanage
Platform
(as a Service)
Managedbyvendor
Youmanage
Storage
Servers
Networking
O/S
Middleware
Virtualization
Applications
Runtime
Data
Software
(as a Service)
Managedbyvendor
Storage
Servers
Networking
O/S
Middleware
Virtualization
Applications
Runtime
Data
8. BCDR para SQL Server On-Premise
• Copias de seguridad
• Full
• Diferencial
• Log de transacciones
• SQL Cluster
• Log Shipping
9. BCDR para SQL Server On-Premise
• Database Mirroring
• AlwaysON
• Replicación
• Vistas Instantáneas de bases
de datos (Snapshots)
10. BCDR para Azure SQL DB
• No soporta
• Copias de seguridad
• Full
• Diferencial
• Log de transacciones
• AlwaysON
• SQL Cluster
• Mirroring
• Log Shipping
12. Azure SQL DB
Bases de datos como un servicio
• Microsoft toma toda la responsabilidad de la seguridad de sus datos
• Con cada nivel, el tiempo de actividad SLA definido es del 99.99% de
disponibilidad
• El tiempo de inactividad para aplicaciones 24x7 pueden causar enormes
pérdidas financieras
Performance Tier Uptime SLA
Basic 99.99%
Standard 99.99%
Premium 99.99%
Web 99.9%
Business 99.9%
13. Exportar una base de datos
Crear una copia de la base de datos
• Asegurar una copia consistente transaccional
Pro Contra
Formato de datos portable – Esquemas y
datos lógicos
Necesidad de solución (DB-Copy) para
garantizar la base de datos consistente
Bajo costo Lento para restaurar
14. Exportar una base de datos
Exportar copia de seguridad a cuenta de almacenamiento
• Exportación las cuentas de almacenamiento de los clientes
15. Exportar una base de datos
Repita según sea necesario
• Crear copia de archivo adicionales
según sea necesario
16. Tipos de BCDR para Azure SQL DB
• Recuperación desde una maquina con fallos
• Recuperación desde errores accidentales – Recuperaciones
innecesarias
• Recuperación desde la caída de alguna Región y/o Datacenter
17. Recuperación desde una maquina con fallos
Las lecturas se efectuará directamente en el primario
Escrituras son replicadas en las secundarias
Base de datos lógica individual
Escritura
Escritura Ack
Ack
Lectura
Valor Escritura
Ack
18. Recuperación desde una maquina con fallos
Capacidades criticas:
• Crear nuevas replicas
• Sincronización de datos
• Coherencia de escenarios
• Detección de fallas
• Failover
• 99.99% de disponibilidad
19. Recuperación desde errores accidentales –
Recuperaciones innecesarias
Geo-replicación
Restauración desde
una copia de
seguridad
Copia de seguridad
SQL Database
sabcp01bl21
Azure Storage
sabcp01bl21
20. Recuperación desde errores accidentales –
Recuperaciones innecesarias
Copia de seguridad automática
• Copias de seguridad completas
semanales, Diferentes copia de
seguridad diaria, Copias de
seguridad cada 5 minutos.
• Copias de seguridad diarias y
semanales cargadas
automáticamente al
almacenamiento de Azure geo-
redundantes (Azure Storage)
21. Recuperación desde errores accidentales –
Recuperaciones innecesarias
Auto-servicio de
restauración
• Punto en el tiempo
hasta un segundo
de granularidad
• REST API,
PowerShell o Portal
• Crea una nueva
base de datos en el
mismo servidor
lógico
22. Recuperación desde la caída de alguna
Región y/o Datacenter
Política de retención de
información en niveles
• Basic - 7 días
• Standard - 14 días
• Premium - 35 días
Sin costo adicional para mantener
copias de seguridad
23. Restauración de bases de datos eliminadas
Autoservicio de
restauración hasta el
punto de eliminación
Copias de seguridad para los días 7, 14, 35
Ahora -7 díasTiempo
24. Restauración de bases de datos eliminadas
Recuperación después de la eliminación
accidental de una base de datos
• Restaura la base de datos hasta el punto de
eliminación (Copias de seguridad anteriores
son borrados)
• Crea una nueva base de datos en el servidor
utilizado por la base de datos original
• Usted puede optar por la conmutación por
error a la base de datos restaurada o usar
secuencias de comandos para recuperar datos
25. ActivarGeo-Replicación
LS ABC
South Central US
West US
Conmutación por
error (Failover) y
activación de
secundaria (En
cualquier momento)
East US
DB1
LS XYZ LS OPQ
DB1
DB1.old
North Central US
LS DFE
DB1
DB1
26. Activar Geo-Replicación
• RTO (Recovery Time Objective) < 1 hora, RPO
(Recovery Point Objective) < 5 minutos
• REST y API de PowerShell para opt-in y
Conmutación por error (Failover)
• DMV (Dynamic Management Views) + REST
para monitorear y dirigir las decisiones
generadas por la conmutación por error
• Replicación automática de datos y
sincronización
• Hasta 4 bases de datos secundarias en línea
con niveles de desempeño correspondiente
en cualquier región
28. Recuperación desde interrupciones en los
datacenter y/o regiones
Replicación estándar
East US
US West
LS ABC
Conmutación por error
(Failover) y activación de
secundaria (Durante
incidentes) West US
DB
LS XYZ
DB
North Central
US
LS OPQ
DB
29. Recuperación desde interrupciones en los
datacenter y/o regiones
• RTO (Recovery Time Objective) < 2 horas, RPO
(Recovery Point Objective) < 5 minutos
• REST y API de PowerShell para opt-in y
Conmutación por error (Failover)
• Sincronización y replicación de datos automático
• DMV (Dynamic Management Views) + REST para
supervisar y orientar las decisiones de conmutación
por error
• Offline Individual secundaria con nivel de
desempeño vinculada en la región DR (Disaster
Recovery)
31. Geo-Restauración de bases de datos
Geo-Replicación
Copias de seguridad
SQL Database
sabcp01bl21
Azure Storage
sabcp01bl21
Restaurar en
cualquier
región Azure
32. Geo-Restauración de bases de datos
• Autoservicio API de restauración
• Restaura la última copia de
seguridad diaria
• Sin costo adicional, no hay
garantía de capacidad
• RTO >= 24 horas, RPO = 24
horas
• URL de la base de datos cambiará
después de la restauración
34. Modelos de niveles BCDR
B
Transacciones
por horas
Transacciones
por minutos
Transacciones
por segundos
ERT*<12h
RPO**<1h
ERT<12h
RPO<1h
ERT<12h
RPO<1h
ERT<30s
RPO<5s
ERT<30s
RPO<5s
ERT<30s
RPO<5s
• * Tiempo de Recuperación Estimado (En ingles: ERT) - La duración estimada para la base de datos debe ser totalmente funcional después de
solicitar la restauración y su recuperación tras errores.
• ** Objetivo de Punto de Recuperación (En ingles: RPO) - La cantidad de cambios de datos más recientes (Según un intervalo de tiempo)
podría perder la aplicación después de la recuperación.