Monitoração é um dos pontos mais importantes no suporte e administração de ambientes de TI, ela é responsável por permitir prever o futuro, avaliar riscos e ver a saúde de um ambiente. Os novos sistemas de monitoração são capazes de gerar relatórios baseados no consumo diário de um link, este relatório apresenta como resultado final três pontos importantes:

  • O link atende as necessidades atuais da empresa.
  • O link atenderá o crescimento quanto ao consumo de banda futuro.
  • Caso haja uma redução, haverá lentidão na rede.

Com essas informações é possível prever até o orçamento de TI do próximo período fiscal.

Outros sistemas de monitoração já são capazes de indicar qual componente de um datacenter, seja ele memória, disco ou CPU, é o responsável pela lentidão ou queda de um sistema. Esta monitoração também consegue gerar o correlacionamento de incidentes, mitigando falsos alertas e focando no problema.

O segredo de uma boa monitoração está na configuração dos thresholds, aonde um determinado ponteiro será considerado como alerta e abrirá um chamado ou incidente, exemplo: o consumo de 90% de CPU abrirá um chamado de risco na monitoração, indicando que há algum problema no servidor ou roteador, a partir disso um analista irá verificar o que está ocorrendo, antes da queda do equipamento.

A configuração de thresholds é a parte mais importante na implementação da monitoração em um ambiente, é este o processo responsável por garantir a saúde da sua infraestrutura, o seu sono e o seu emprego.

Vejam que os thresholds possuem uma configuração padrão para grande maioria dos sistemas e hardwares, mas sabemos que nem tudo funciona como descrito pelo fabricante ou pelo manual, daí a importância de verificamos a eficiência deles, deixe o seu ambiente em teste durante 1 semana, avalie os incidentes ou chamados abertos pela sua monitoração, veja o nível de criticidade que a monitoração está utilizando.

Há excelentes sistemas de monitoração no mercado, pagos e de graça, mas nunca se esqueçam, até a monitoração deve ser monitorada. Já tive problemas onde a monitoração de todo um ambiente ficou fora do ar por não termos ativado um agente para ficar de olho no disco do servidor, da própria monitoração.