ANALISE DE DESASTRE E RECUPERAÇÃO Cliente: SQL Saturday #361 Data: 25/04/2015 Próxima revisão: 26/04/2016 SUMÁRIO Analise de Desastre e Recuperação ...............................................................................................1 Parâmetros: .......................................................................................................................................1 Coleta de Dados .............................................................................................................................2 Tempo de Backup por Banco de Dados (min) .........................................................................3 Tamanho Dos Backups (FULL) ........................................................................................................3 Tempo de Recuperação por Banco de Dados ........................................................................4 Plano de Backup ..............................................................................................................................4 Servidor EKO Instância Default ..................................................................................................4 Plano de Desastre ............................................................................................................................5 Servidor eko Instância Default ...................................................................................................5 Análise de perdas e Riscos .............................................................................................................5 Geral ...............................................................................................................................................5 eko – adeventureworks ...............................................................................................................5 PARÂMETROS: Os bancos de dados foram classificados em categorias, a primeira por impacto em caso de desastre e a segunda por tamanho de informações. Abaixo seguem as configurações destes parâmetros: 1 Por categorias de impacto, que são: Missão Critica (A): Todos os bancos de dados que se contraírem quaisquer problemas prejudica a integração de artefatos de software, essa classe tem prioridade no SLA de atendimento; Negócios Critico (B): Se houver problemas nesta categoria o negócio do cliente pode contrair despesas financeiras prejudicando o bom andamento do negócio; Impacto Moderado (C): Apesar de causar um impacto no negócio ou possibilita uma janela maior de manutenção poderá causar perdas financeiras ou falhas de integrações de dados; Baixo, sem impacto e não critico (D): Sem tirar a devida importância destes artefatos são aqueles que recebem atualizações com maior distância de tempo, ou não possuem integrações críticas. Por tamanho de Banco de Dados: Muito Grande (A): Igual ou maior que 2tb; Grande (B): Entre 1tb e 1,999tb; Médio (C): Entre 500gb e 999gb; Pequeno (D): Entre 1gb e 499gb. COLETA DE DADOS A coleta de dados está dividida por servidor, instância, classificação de criticidade e tamanho. Servidor Instância Banco de Dados Criticidade Tamanho Eko Default Adventureworks A A RH B B 2 NFe A C Historico D D TEMPO MÉDIO DE B ACKUP POR BANCO DE DADOS (MIN) Servidor Eko Instância Default Banco de Dados Tam. Full Diff Log AdventureWorks A 300 120 3 RH B 150 80 1 NFe C 80 30 1 Historico D 30 20 1 Tam. Full Full Comp. Adventureworks A 2500.000 1000.000 RH B 780.00 250.00 NFe C 450.00 134,53 Historico D 50.000 10.000 TAM ANHO DOS B ACKUPS (FULL) (MB) Servidor Eko Instância Default Banco de Dados 3 TEMPO MÉDIO DE RECUPERAÇÃO POR B ANCO DE DADOS (MIN) Servidor Eko Instância Default Banco de Dados Tam. Full Diff Log Adventureworks A 350 150 5 RH B 200 90 2 NFe C 100 30 1 Historico D 30 10 1 PLANO DE B ACKUP SERVIDOR EKO INSTÂNCIA DEFAULT Banco de dados: AdventureWorks; Recovery Model: Full; Backup Full: a cada domingo; Backup Diferencial 1: todos os dias às 0 entre segunda-feira até sábado; Backup dos Logs 1: todos os dias a cada 10 minutos entre as 8h até 11h; Backup dos Logs 2: todos os dias a cada 30 minutos entre 11h até 13:30; Backup dos Logs 3: todos os dias a cada 10 minutos entre 13:30 até 18:45; Backup dos Logs 4: todos os dias a cada 50 minutos entre 18:45 até 0h; Backup dos Logs 5: todos os dias a cada 60 minutos entre 3h até 8h exceto aos domingos. 4 PLANO DE DESASTRE O plano de desastre consiste na descrição dos procedimentos de recuperação de cada banco de dados assim como a análise das perdas causadas pelos possíveis desastres. SERVIDOR EKO INSTÂNCIA DEFAULT Banco de dados AdventureWorks: Checklist de restore conforme documento interno xyz.doc; Em caso de descoberta de desastre serão comunicados na ordem a seguir: Zé: 051 99168577; Maria: 051 9992 1879; ANÁLISE DE PERDAS E RISCOS Com base nas informações coletadas podemos prever alguns riscos com relação aos cuidados de manutenção e arquivamento, além de definir qual o percentual estatístico de perdas em caso de um desastre. GERAL Todos os backups estão sendo realizados diretamente em um único compartilhamento da rede, recomendamos o espelhamento destes backups. Os tempos descritos abaixo não contam o tempo de recuperação da fita. Todos os dados foram testados, mas podem haver diferenças conforme os bancos de dados forem crescendo. EKO – ADEVENTUREWORKS Este banco de dados é considerado de tamanho muito grande e criticidade alta. 5 Em caso de desastre o tempo para recuperação irá depender do dia do horário, por este motivo propomos o melhor e o pior cenário. Melhor cenário: O desastre ocorre logo após à 0 hora da manhã de domingo, para esta recuperação será necessário a recuperação de um backup completo (~6 horas e um tail log (~2 minutos) no total serão 6 horas e 2 minutos para recuperar a base e mais o tempo para recuperar o acesso. Pior cenário: O desastre ocorrer próximo às 23 horas. Para esta recuperação será necessário restaurar o backup completo (~6 horas), o último diferencial (~3 horas), aplicar as 36 cópias de logs de transações feitas até antes do sinistro (~80 minutos) e o tail log (~20 minutos), sendo assim serão necessários 698 minutos (~11 horas). O risco assumido aqui são os 45 minutos não cobertos do backup de log. Ainda é possível tentar recuperar pelo tail log. 6