Essa é uma frase que eu digo sempre que passo em um dos meus clientes e eles descobrem que o seu principal site ou aplicativo está fora do ar porque algum usuário ligou para o chefe, dá melhor forma possível.

Monitorar ambientes é uma necessidade básica para qualquer empresa de TI, e o hoje a monitoração não se restringe só em saber se o site ou equipamento está no ar, com um sistema adequado e bem configurado de monitoração é possível capturar informações que indicam que algo está com problemas, mas antes de acontecer uma queda.

Exemplo: analisando informações de CPU, Memória e Disco é possível saber se o servidor está sobre-carregado chegando até mesmo a suspeitar de uma possível falha de hardware. Há uma série de threshoulds que capturamos nos servidores aplicacionais e servidores WEB que indicam que uma aplicação ou sistema está com algum problema antes de “capotar”.

Nagios e Cacti são duas ferramentas opensources amplamente utilizadas por diversas empresas para monitorar ambientes de todos os tamanhos, isso porque elas possuem uma gama de plugins, extensões e configurações praticamente prontas para serem implementadas, economizando tempo, porém muitos gestores e diretores ainda olham com a cara amarrada para esse tipo de solução, opensource, pois não tem quem culpar em caso de falhas.

O ponto aqui é: Monitore o seu ambiente, tenha o máximo de informação útil possível, informação essa que poderá ser analisada e gerar relatórios de performance para o seu ambiente e para o seu cliente, no final das contas você irá trabalhar menos. 🙂

P.S.: O blog Brainwork traz uma série de guias para configuração passo a passo do Nagios e do Cacti.