Terminei a primeira turma do curso de arquitetura focada em Amazon. O pessoal mandou muito bem por sinal. Daí, em uma parte da aula, sou questionado quanto a viabilidade técnica e financeira quando utilizarmos o S3 da Amazon como área de backup.

O S3 é muito bom para fazer esta função, mas acontece que ele é caro, na verdade, bem caro, principalmente quando falamos em teras e mais teras de dados armazenados na nuvem.

Eis que a Amazon desenvolveu o Glacier, uma solução de archive/backup que cobra US$ 0.01 por giga armazenado. Parece mentira, mas não é. O serviço funciona, tendo um SLA de 99,9999%, e ainda por cima já desenvolveram uma ferramenta em python, o mt-aws-glacier, que auxilia, via linha de comando, a sua utilização. Facinho, Facinho.. .

Alguns pontos importantes quanto ao Glacier:

  • Ele é realmente barato – fiz algumas simulações de alocação de 750GB e o resultado foi a cobrança de US$ 20.00/month
  • Não tudo é perfeito. Este serviço demora até 12 horas para atualizar o seu inventário, quer dizer, para apresentar na console do AWS uma lista de arquivos que foram “upados”  para p vault que você criou.
  • O mt-aws-glacier funciona em multi-thread, tendo assim a possibilidade de subir mais processo para acelerar a transferência de arquivos do servidor para o serviço da amazon. O problema é que isso consome muita CPU do servidor que está executando o programa desta forma.
  • A solução que implementei para resolver este problema em um dos meus ambientes foi “Subir um novo server de US$ 5.00 – digital ocean é o bicho – exportar um NFS no servidor que preciso fazer o backup, importar no server novo, e a partir dele, rodar o mt-aws-glacier para fazer o upload dos arquivos desejados.”

O mt-aws-glacier ainda gera um arquivo de logs com todos os dados quanto ao processo de upload dos arquivos – bem interessante.

A dica que fica é “Amazon Glacier é a melhor e mais barata solução de backup para o seu ambiente, quando falamos sobre tudo na nuvem.”