Essa semana eu estive discutindo sobre um projeto de um site secundário com um cliente, como a crise acabou e sobrou dinheiro, o cliente deseja montar um site backup de suas operações mais importantes: Banco de dados, serviços web e comunicação com outras aplicações.

Várias empresas, principalmente instituições financeiras gastam milhões de reais na compra de hardware e software para criação de ambientes de backup, além é claro da alta disponibilidade e redundâncias de suas operações produtivas.

A replicação de dados realizada por storages utilizando tecnologia Gigabit de tráfego de redes é uma das soluções mais utilizadas, tendo EMC, Hitachi e Netapp como os fornecedores mais conhecidos pelo mercado. A EMC possui uma das soluções de storage e de backup mais robustas e implementadas no mundo, além de possuir um dos maiores preços.

Já trabalhei em projetos para implementação de storage utilizando EMC, Hitachi e Netapp, o custo benefício das soluções de storage e disco da Hitachi e Netapp são maiores que se compararmos com a EMC. Mas um ponto deve ser analisado, a arquitetura do ambiente que você deseja montar versus a arquitetura do ambiente pré-existente, já que o ambiente produtivo deve falar e ser, na grande maioria dos casos uma cópia fiel um do outro, Produção = Backup.

Algumas das tecnologias dos 3 fabricantes comentados não possuem compatibilidade entre si, podem assim afetar o projeto de criação de um site backup. Eu já tive problemas na implementação de uma solução EMC com Hitachi, infelizmente devido a incompatibilidade.

Na criação da arquitetura da solução de backup ou do site secundário, você deverá ter em mente que um dia possui 24 horas, sendo assim, você terá somente esse período para fazer backup. Aqueles que trabalham em grandes ambientes corporativos sabem que 24 horas é pouco tempo quando temos que realizar o backup de centenas de gigabytes ou terabytes, haja robôs, drivers e fitas de backup para tudo isso.

Uma solução para estender o tempo do backup é a utilização de storage como áreas de backup, em alguns casos, simulando uma fita de backup, VTL (Virtual Tape Library). O interessante dessa solução é que os discos utilizados para ela podem ser de tecnologia SATA/II, muito mais baratos e com uma área de armazenamento bem maior que os demais (SSD / SCSI / SAS), chegando a 2TB por disco, atualmente e podendo aumentar de acordo com a oferta de tamanho destes discos.

Imaginem que em uma gaveta para armazenamento de discos caibam 15 discos/HD, utilizando discos SATA/II de 2TB cada nós teríamos 30TB de área bruta para ser utilizada. Ser utilizarmos discos SAS de 450GB cada, teríamos discos com alta performance mas uma área de backup bruta de 6.7 TB, quase 5 vezes menos espaço.

Você não precisa de alta performance para fazer backup, mas sim de espaço, espaço esse que dará uma área de manobra para o seu backup em fita magnética ou tape library maior, estendendo a sua janela de backup e mais horas, dias ou semanas. Trabalhei em uma empresa que possui a política de ter em VTL 40% de sua área total em Storage, com isso ela possui armazenado na VTL de 7 dias para backup. Caso haja necessidade de um restore, o mesmo será muito mais rápido do que se for realizado via tape library, não se segue restore de fita é N vezes mais lento que de um Storage.

Um vídeo da EMC explicando a sua solução de VTL:

No caso de um site ou storage secundário é importante lembrar do tempo que o mesmo fará a sincronização de dados com o ambiente de produção, esse tempo pode ser vital na hora da realização de um restore ou no caso da criação de um dado errado que não possa ser duplicado, não gerando assim maiores problemas.

Grandes instituições possuem a duplicação da duplicação ou reduplicação, como alguns chamam, onde há 3 storages, um duplicando os dados do outro mas com tempos diferentes. O storage primário é sincronizado com o secundário a cada 10 minutos, e o secundário é sincronizado com o terciário a cada 30 minutos. Este ambiente possui 40 minutos para que uma falha na duplicação dos dados seja evitada. Fora é claro o backup que também é realizado do ambiente produtivo e do ambiente duplicado, o terceiro storage não sofre backup.

Um outro ponto importante para a arquitetura do site secundário ou backup é a rede. A criação de uma rede apartada e bem configurada é primordial para performance e integridade do seu backup. Em ambientes de grande porte já são utilizadas redes de 10Gbps e no mínimo de 2gbps (utilizando duas placas de rede por servidor), a implementação de um rede totalmente apartada das demais redes é para não haver concorrência já que em determinados horários há picos na transmissão de dados.

Conheci empresas que pagaram multas altíssimas por não terem um determinado arquivo e pessoas que perderam os seus empregos por não terem backup de um determinado dado. Faço sempre um backup quando me deparo com uma situação de deleção de um arquivo em produção. Quem guarda tem, principalmente quando se trabalha com suporte a desenvolvimento.