O documento discute arquiteturas de alta disponibilidade e durabilidade com Amazon EBS. Ele apresenta oito arquiteturas diferentes, incluindo uso de EBS solo, EBS com DRBD, clusters com Pacemaker usando EBS ou armazenamento efêmero, GlusterFS, Windows Server 2012 e Windows Server 2012 com DFS. O documento fornece detalhes técnicos sobre como implementar cada arquitetura.
2. O que nós vamos aprender?
• O que é o EBS?
• Durabilidade
– Gerenciamento de Snapshots
• Alta Disponibilidade
– Arquiteturas com Replicação e Failover
11. Snapshots
• Funcionalidade nativa do EBS
• Nós não tiramos snapshots automaticamente
• Mais durável do que um volume EBS
– Armazenado no S3
– Se você armazenar 10,000 objetos no S3, em média nós podemos perder um
deles a cada 10 milhões de anos aproximadamente.
• Diferencial (uso eficiente de espaço)
– Primeiro snapshot é um clone
– Pague somente pelo que você usou
• Independente de AZ
– Clone em qualquer AZ
• Pode ser copiado de forma eficiente entre regiões
12. Porque tirar Snapshots?
• São mais duráveis do que o Amazon EBS:
99,999999999.
• Versionamento
• Backups
• Custo
13. Consistência dos Dados
• Para garantir a consistência dos dados, o ideal é
pausar todas as escritas:
– Congelando o Sistema de Arquivos:
• xfs_freeze -f /mount/point
• xfs_freeze -u /mount/point
– Ou desmontando o volume;
– Ou desligando a instância (para root volumes);
14. Tirar um snapshot é muito fácil
create-‐snapshot
delete-‐snapshot
copy-‐snapshot
15. Gerenciar Milhares de Snapshots Não é
Nada Fácil!!!
• Um snapshot precisa seguir um certo ciclo de
vida.
– Período de Retenção
– x versões
– x diários, y semanais, z mensais
– Copiado entre regiões
• Snapshots de arrays
17. Gerenciamento de backup
Ciclo de vida: criacao, copia entre regioes,
retencao/limpeza
Restore organizado com configurações
Agendamentos
18.
19.
20. Casos de uso
• Backup diario/multiplos por dia
• Backup com retencao customizada – exemplo:
manter copias de servidores por mais dias
• Backup com GrandFather-Father-Son (Mensal-
semanal-diario)
• Disaster recover: copia entre regioes
22. Por que arquiteturas de alta
disponibilidade?
• EBS não é Multi-AZ, por definição. Mas pode ser
com a arquitetura certa!
• Para conseguirmos alta disponibilidade, precisamos
nos preocupar com:
– Compartilhamento
– Replicação
– Failover
23. Compartilhamento
• NFS e CIFS: Protocolos usados para
compartilhamento de arquivos
• Versões –
– NFS v4
– SMB v3
26. Considerações Importantes
• Disponibilidade
– Single AZ = Sem SLA
– Multi AZ = SLA de 99.95% de disponibilidade
• Durabilidade
– Depende do tipo de storage: Efêmero, EBS, S3…
• Performance
– Network interface (Low, Moderate, High)
– EBS interface (EBS Optimized)
– EBS performance (PIOPS)
• Consistência
– Fique atento aos tipos de replicação: síncrona, assíncrona…
27. Tipos de Storage envolvidos nas nossas
Arquiteturas
• EBS
– Entre 0.1% – 0.5% de Taxa Anual de Falha por volume
• Efêmero
– hs1.8xlarge
• 48 terabytes de storage, 24 discos rígidos
– i2.8xlarge
• ~5.7 terabytes de storage, 8 SSDs
• S3
– Desenhado para 99.999999999% de durabilidade
33. 2) Efêmero com DRBD para o EBS
NFS
SAMBA
MDADM
RAID 0
array
MDADM
RAID 0
array
DRBD
protocol A
replication
Replicação Assíncrona
Monitorar a latência desta replicação
é crítico!
Tire Snapshots do EBS array
# cat /proc/drbd #look for ‘oos’
34. Efêmero com DRBD para o EBS
global
{
usage-‐count
yes;
}
common
{
net
{
protocol
A;
}
}
#
/etc/drbd.d/global_common.conf
35. Efêmero com DRBD para o EBS
resource
r0
{
on
az-‐a{
device
/dev/drbd0;
disk
/dev/md0;
address
10.1.1.1:7789;
meta-‐disk
internal;
}
on
az-‐a{
device
/dev/drbd1;
disk
/dev/md1;
address
10.1.1.1:7789;
meta-‐disk
internal;
}
}
#/etc/drbd.d/r0.res
36. 3) Cluster com Pacemaker e EBS
EBS
NFS
SAMBA
EBS
NFS
SAMBA
DRBD
protocol C
PACEMAKER
AZ-A AZ-B