Quem trabalha na área de TI, especialmente aqueles que trabalham com suporte, já devem ter ouvido falar na necessidade da confecção de um documento chamado RCA – root cause analysis – Documento de Análise de Causa Raiz, é um documento que serve para apontar o que causou o problema ou indisponibilidade, isso porquê na maioria das empresas em que trabalhei, este documento só foi solicitado e confeccionado depois da indisponibilidade de algum serviço ou ambiente.

Existe uma série de formas ou técnicas utilizadas para o preenchimento da RCA, porém as mais utilizada pelas empresas de TI é a dos porquês, exemplo:

Por que o ambiente ficou fora ? Porque o servidor apresentou um problema na placa de rede. Por que a placa de rede apresentou problema ? Porque foi um problema de hardware. O que será feito para que isso seja resolvido ? Troca da placa de rede.

Há uma série de outras formas de responder essas perguntas, porém a dica que eu dou é objetividade, seja claro e objetivo na hora de explicar um problema e a solução empregada para resolvê-lo, alinhe previamente com os times envolvidos (já que não trabalhamos sozinhos) para o preenchimento da RCA, depois você não irá querer confrontar uma resposta ou explicação com outro time.

Não se assustem caso encontrem uma RCA preenchida com as seguintes frases:

  • Falha humana
  • Causa indeterminada
  • Solução paliativa

O problema não escrever essas frases e sim, o seu cliente aceitar. 🙂

abaixo segue uma lista das principais técnicas utilizadas para o preenchimento de uma RCA:

  • Barrier analysis – a technique often used in particularly in process industries. It is based on tracing energy flows, with a focus on barriers to those flows, to identify how and why the barriers did not prevent the energy flows from causing harm.
  • Bayesian inference
  • Causal factor tree analysis – a technique based on displaying causal factors in a tree-structure such that cause-effect dependencies are clearly identified.
  • Change analysis – an investigation technique often used for problems or accidents. It is based on comparing a situation that does not exhibit the problem to one that does, in order to identify the changes or differences that might explain why the problem occurred.
  • Current Reality Tree – A method developed by Eliahu M. Goldratt in his theory of constraints that guides an investigator to identify and relate all root causes using a cause-effect tree whose elements are bound by rules of logic (Categories of Legitimate Reservation). The CRT begins with a brief list of the undesirables things we see around us, and then guides us towards one or more root causes. This method is particularly powerful when the system is complex, there is no obvious link between the observed undesirable things, and a deep understanding of the root cause(s) is desired.
  • Failure mode and effects analysis
  • Fault tree analysis
  • 5 Whys
  • Ishikawa diagram, also known as the fishbone diagram or cause-and-effect diagram. The Ishikawa diagram is the preferred method for project managers for conducting RCA, mainly due to its simplicity, and the complexity of the rest of the methods[1].
  • Pareto analysis
  • RPR Problem Diagnosis – An ITIL-aligned method for diagnosing IT problems.

E a lista dos elementos básicos causadores de um problema:

  • Materials
    • Defective raw material
    • Wrong type for job
    • Lack of raw material
  • Man Power
    • Inadequate capability
    • Lack of Knowledge
    • Lack of skill
    • Stress
    • Improper motivation
  • Machine / Equipment
    • Incorrect tool selection
    • Poor maintenance or design
    • Poor equipment or tool placement
    • Defective equipment or tool
  • Environment
    • Orderly workplace
    • Job design or layout of work
    • Surfaces poorly maintained
    • Physical demands of the task
    • Forces of nature
  • Management
    • No or poor management involvement
    • Inattention to task
    • Task hazards not guarded properly
    • Other (horseplay, inattention….)
    • Stress demands
    • Lack of Process
  • Methods
    • No or poor procedures
    • Practices are not the same as written procedures
    • Poor communication
  • Management system
    • Training or education lacking
    • Poor employee involvement
    • Poor recognition of hazard
    • Previously identified hazards were not eliminated

Estejam acostumados a preencher um RCA em inglês, já fiz várias vezes e ainda me enrolo de vez em quando.

fonte: wikipedia