Você nunca ouviu aquelas frases prontas de um time com um desculpa mediana que se tal coisa funciona, tudo do lado deles está ok!? E o time de redes que diz que se um determinado servidor está “pingando” é porque a rede está funcionando 1000000%.

A verdade é que muitos destes times têm problemas na análise e diagnóstico de problemas, e isso é devido a falta de configurações adequadas de debug , de softwares ou equipamentos que não foram comprados e que auxiliariam em muito esta análise e diagnóstico.

Uma coisa importante que deve ser vista em redes ou infraestruturas muito grandes é o caminho ou rota que um determinado pacote TCP/UDP trafega para chegar no seu destino final, no meio do percurso pode haver um switch, porta, roteador, cabo ou operadora com problemas, problemas estes que não podem ser detectados facilmente com um simples ping, para isso é necessário coletar uma série de dados e evidências que possam lhe auxiliar no diagnóstico e possível solução. Essa tarefa também não é indicada para pessoas inexperientes já que o que conta muito nessas horas é a experiência em outros ambientes ou a quantidade de problemas que esse profissional já vivenciou.

Tive um chefe que dizia que a diferença entre uma analista sênior, pleno ou júnior era o tempo que o profissional demorava para resolver um problema, o analista sênior deve levar menos tempo do que os demais analistas, mas nem sempre funciona assim. Pensar em diferentes variáveis e possibilidades não é tarefa simples e nem todos possuem essa capacidade. A infraestrutura de um datacenter de uma grande empresa possui centenas, ou ate mesmo milhares de variáveis para serem analisadas.

Já tive problemas em grandes redes que o causador era um switch conectado em uma rede elétrica com problemas, a diferença de corrente elétrica que passava neste switch era tamanha que gerava problemas em diversos equipamentos que se interligavam diretamente. E para descobrir? Foi no dia que um carinha desligou acidentalmente o switch e entrou a redundância, naquele momento a rede voltou a funcionar em uma velocidade que era possível trafegar TB (terabytes) em poucos minutos.

Como diz um amigo: Só o stress constrói. Essa frase é uma simples verdade quando o assunto é experiência. Os livros trazem conhecimento, mas a experiência resolve problemas, não achem que todas as respostas quanto a redes, servidores e Internet está no Google, mas sim no seu dia a dia.

Analisem com calma os problemas do seu dia a dia, documentem novos problemas e principalmente as soluções. Grandes problemas muitas vezes possuem pequenas soluções que documentadas, podem gerar excelentes discussões. Perguntem, não achem que vocês sabem tudo, um colega de trabalho pode ter uma ideia que lhe auxiliará a resolver aquele enigma.

Compartilhar:

Este post tem 9 comentários

  1. Eu tenho o mesmo a dizer sobre os profissionais de aplicação! Nem todos os problemas da aplicação estão na rede!
    Mas tudo bem, voce falou de redes, vamos lá. Me impressiona que ainda hoje utilize-se apenas PING como ferramenta de troubleshooting, quando ja temos equipamentos com aplicação de serviço em funcionamento há uns bons 8 anos (no mínimo).
    Me impressiona também (e é a maioria) que os profissionais de rede não tenham ideia de como é um cabeamento e nunca tenham ouvido falar de elétrica, quando a elétrica é a base disso tudo. Mas é isso ai… Trocentos tiram certificação cisco para ganhar mais no emprego, para conseguir novo emprego, para fazer seu “alpinismo salarial”, mas nunca ouviram falar de relação sinal /ruído. Ouvi de um cliente uma vez ( trabalhava em uma operadora) que ele SABIA que CRC não causaria problemas na aplicação, porque ele era CCNA. o_O como eu era uma simples atendente, ele não quis deixar o técnico da ultima milha entrar pra verificar, mas exigia que o problema fosse solucionado. (Ele administrava o servidor da empresa) AMÉM!

  2. Bacana o Post Gustavo.

    Já tive problemas curiosos em uma rede que administrei por mais de 3 anos. Inclusive com um Hub antes de estrutura-la, no comecinho quando entrei na empresa, que o bendito derrubava o server de banco de dados.

    Olha, experiência é tudo. Conheci um admin de telecom da Telemar na epoca, tinha nada menos que 20 anos na area apenas com routes, tcpax etc….. em uma conversa que tivemos ele disse que mesmo com toda experiência adquirida, ainda encontrava problemas que nunca tinha visto.

    Acho que, a ideia de estarmos sempre lidando com tecnologias novas e por si, novos problemas, é a parte mais empolgante de T.I.

    Como o Gustavo disse muito bem. “Não ache que sabe de tudo.”
    E eu completo, “Meu conhecimento termina onde o seu começa, e vice versa.”

    Abraços.

  3. Patricia, interessante o que você disse também.

    Se eu não estou enganado, só pra ter uma base sobre a ideia/logica do ping (logica usada pra encontrar erros), no ano passado, fizeram um index de um estudo que indicaria que, nem tudo que está disponivel na teia da internet estaria disponivel pra todos que estão conectados a ela.

    Descobriram que há “buracos” na web que impossibilitam que as requisições cheguem até o (s) server (s).
    Infelizmente, nem sempre a logica aponta para uma solução, ou dita regras em T.I.

    Abraços.

  4. Hecton, pois é por isso que me impressiona, porque hoje eu ESCOLHO os tipos de pacote que passam ou não em um elemento de rede. Muitos IPs por questão de segurança, não ficam disponíveis para responder. E isso é natural, em um mundo onde temos tantos Hackers. Se eles não sabem da minha existência, as chances de me atacarem é menor. (não é uma regra que elimina o hacker, mas uma diminuição do risco apenas).

    E eu estou com este profissional de telecom seu amigo. TODO DIA é um problema diferente em redes. Não há rotina! Você pode até usar um meio de descobrir o problema anteriormente, mas são tantas variáveis, que não basta limitar a pesquisa à isso ou aquilo.
    Uma experiencia particular em uma empresa, passamos 2 MESES pesquisando um problema. O equipamento dava alarme de queda entre 7h50 e 8h15 no maximo. Depois ficava estavel. Mas estas quedas de no maximo meia hora, ficavam registradas. Eis o stress com o cliente. O link não era confiavel! Achamos o defeito 2 meses depois. Um conversor que “reagia” ao aumento da carga eletrica no site, este era o horário em que o segurança religava a luz no galpão da fábrica! 😀

  5. Patricia, a rede que mencionei que administrei era de uma rede de supermercados da minha cidade. Não havia um checklist das condições das instalações eletricas havia DECADAS.

    Resultado, quando a câmera fria era acionada pelos geradores (o consumo eletrico e a intereferencia que causa na rede eletrica é absurda), sentia o pico de energia nos PDVs, na frente da loja. Algo simplesmente louco. Em 3.6 anos contabilizei mais de 20 HDs torrados por conta disso (detalhe, queima de no-breaks era comum). Infelizmente, a politica do (custa caro pra empresa refazer toda estrutura eletrica, se vira com que tem) falava mais alto.

    Quanto a ips disponiveis (recebimento de ping). Me referia a esse index. http://hubble.cs.washington.edu/ da uma olhada.

    Abraços.

  6. essa e uma verdade, nem sempre temos o maior conhecimento. Muitas vezes vemos as coisas de forma tão aprofundada que quando chega um leigo com aquela solução besta, no final e ela que funciona herhe

  7. Trabalho com Redes e muitas vezes temos que achar problemas nas em aplicações pois muitos desenvolvedores (Programadores) empurram o problema da aplicação para a Rede.
    A melhor forma de achar problema em aplicação e utilizando um Sniffer.

  8. Rodrigo, passo por estes problemas quase todos os dias, de um lado os evangelistas, onde o código JAVA funciona, sem erros. Do outro lado estão os engenheiros e arquitetos da rede, isso me faz lembrar Matrix 2 e 3, arquitetos com os seus ternos brancos e intocáveis, quase divinos. Quando os dois mundos se chocam, pernas para que quero. Sniffer é uma ferramenta essencial para os dias de hoje, dai o motivo pelo qual eu comprei o livro da Laura Chappell, recomendo para todos.

  9. Tinhamos um problema de queima de equipamento constante aqui na empresa onde trabalho. O engenheiro que fez a obra era amigo do dono e por conta disso confiou de olhos fechados. Um dia tive um problema com uma tomada e chamei o eletricista. Ele verificou as polaridades e viu que o terra estava no lugar do neutro, a fase no lugar do terra e assim ia… Entao resolvi checar todas e para meu espanto, todas estavam com esse problema além de descobrir que o terra nao funcionava tambem. Entao foi puxado um terra do edificio ate nossa sala e as polaridades foram acertadas. Conclusao: Alem de nenhum equipamento queimar sozinho (placa-mae era a campea), a conta de luz diminuiu em 50%.

Deixe uma resposta

Fechar Menu