Analise de Desastre e Recuperação Cliente X

Propaganda
ANALISE DE DESASTRE E RECUPERAÇÃO
Cliente: SQL Saturday #361
Data: 25/04/2015
Próxima revisão: 26/04/2016
SUMÁRIO
Analise de Desastre e Recuperação ...............................................................................................1
Parâmetros: .......................................................................................................................................1
Coleta de Dados .............................................................................................................................2
Tempo de Backup por Banco de Dados (min) .........................................................................3
Tamanho Dos Backups (FULL) ........................................................................................................3
Tempo de Recuperação por Banco de Dados ........................................................................4
Plano de Backup ..............................................................................................................................4
Servidor EKO Instância Default ..................................................................................................4
Plano de Desastre ............................................................................................................................5
Servidor eko Instância Default ...................................................................................................5
Análise de perdas e Riscos .............................................................................................................5
Geral ...............................................................................................................................................5
eko – adeventureworks ...............................................................................................................5
PARÂMETROS:
Os bancos de dados foram classificados em categorias, a primeira por impacto em caso
de desastre e a segunda por tamanho de informações. Abaixo seguem as configurações
destes parâmetros:
1
Por categorias de impacto, que são:

Missão Critica (A): Todos os bancos de dados que se contraírem quaisquer
problemas prejudica a integração de artefatos de software, essa classe tem
prioridade no SLA de atendimento;

Negócios Critico (B): Se houver problemas nesta categoria o negócio do cliente
pode contrair despesas financeiras prejudicando o bom andamento do negócio;

Impacto Moderado (C): Apesar de causar um impacto no negócio ou possibilita
uma janela maior de manutenção poderá causar perdas financeiras ou falhas de
integrações de dados;

Baixo, sem impacto e não critico (D): Sem tirar a devida importância destes
artefatos são aqueles que recebem atualizações com maior distância de tempo,
ou não possuem integrações críticas.
Por tamanho de Banco de Dados:

Muito Grande (A): Igual ou maior que 2tb;

Grande (B): Entre 1tb e 1,999tb;

Médio (C): Entre 500gb e 999gb;

Pequeno (D): Entre 1gb e 499gb.
COLETA DE DADOS
A coleta de dados está dividida por servidor, instância, classificação de criticidade e
tamanho.
Servidor
Instância
Banco de Dados
Criticidade
Tamanho
Eko
Default
Adventureworks
A
A
RH
B
B
2
NFe
A
C
Historico
D
D
TEMPO MÉDIO DE B ACKUP POR BANCO DE DADOS (MIN)
Servidor
Eko
Instância
Default
Banco de Dados
Tam.
Full
Diff
Log
AdventureWorks
A
300
120
3
RH
B
150
80
1
NFe
C
80
30
1
Historico
D
30
20
1
Tam.
Full
Full Comp.
Adventureworks
A
2500.000
1000.000
RH
B
780.00
250.00
NFe
C
450.00
134,53
Historico
D
50.000
10.000
TAM ANHO DOS B ACKUPS (FULL) (MB)
Servidor
Eko
Instância
Default
Banco de Dados
3
TEMPO MÉDIO DE RECUPERAÇÃO POR B ANCO DE DADOS (MIN)
Servidor
Eko
Instância
Default
Banco de Dados
Tam.
Full
Diff
Log
Adventureworks
A
350
150
5
RH
B
200
90
2
NFe
C
100
30
1
Historico
D
30
10
1
PLANO DE B ACKUP
SERVIDOR EKO INSTÂNCIA DEFAULT
Banco de dados: AdventureWorks;
Recovery Model: Full;
Backup Full: a cada domingo;
Backup Diferencial 1: todos os dias às 0 entre segunda-feira até sábado;
Backup dos Logs 1: todos os dias a cada 10 minutos entre as 8h até 11h;
Backup dos Logs 2: todos os dias a cada 30 minutos entre 11h até 13:30;
Backup dos Logs 3: todos os dias a cada 10 minutos entre 13:30 até 18:45;
Backup dos Logs 4: todos os dias a cada 50 minutos entre 18:45 até 0h;
Backup dos Logs 5: todos os dias a cada 60 minutos entre 3h até 8h exceto aos
domingos.
4
PLANO DE DESASTRE
O plano de desastre consiste na descrição dos procedimentos de recuperação
de cada banco de dados assim como a análise das perdas causadas pelos possíveis
desastres.
SERVIDOR EKO INSTÂNCIA DEFAULT
Banco de dados AdventureWorks:
Checklist de restore conforme documento interno xyz.doc;
Em caso de descoberta de desastre serão comunicados na ordem a seguir:
Zé: 051 99168577;
Maria: 051 9992 1879;
ANÁLISE DE PERDAS E RISCOS
Com base nas informações coletadas podemos prever alguns riscos com relação
aos cuidados de manutenção e arquivamento, além de definir qual o percentual
estatístico de perdas em caso de um desastre.
GERAL
Todos
os
backups
estão
sendo
realizados
diretamente
em
um
único
compartilhamento da rede, recomendamos o espelhamento destes backups.
Os tempos descritos abaixo não contam o tempo de recuperação da fita.
Todos os dados foram testados, mas podem haver diferenças conforme os bancos
de dados forem crescendo.
EKO – ADEVENTUREWORKS
Este banco de dados é considerado de tamanho muito grande e criticidade alta.
5
Em caso de desastre o tempo para recuperação irá depender do dia do horário,
por este motivo propomos o melhor e o pior cenário.
Melhor cenário: O desastre ocorre logo após à 0 hora da manhã de domingo,
para esta recuperação será necessário a recuperação de um backup completo (~6
horas e um tail log (~2 minutos) no total serão 6 horas e 2 minutos para recuperar a base
e mais o tempo para recuperar o acesso.
Pior cenário: O desastre ocorrer próximo às 23 horas. Para esta recuperação será
necessário restaurar o backup completo (~6 horas), o último diferencial (~3 horas), aplicar
as 36 cópias de logs de transações feitas até antes do sinistro (~80 minutos) e o tail log
(~20 minutos), sendo assim serão necessários 698 minutos (~11 horas).
O risco assumido aqui são os 45 minutos não cobertos do backup de log. Ainda é
possível tentar recuperar pelo tail log.
6
Download