Confiabilidade humana - PCS5006

8.11.05

Análise de Confiabilidade Humana




Análise de Confiabilidade Humana
Um método de Engenharia de Sistemas e sua aplicação em Plantas Nucleares




Human Reliability Analysis
E. M. Dougherty, Jr
J. R. Fragola




Introdução

O livro surgiu a partir da experiência de oito anos dos autores em trabalhar com o desenvolvimento de técnicas de confiabilidade humana. O ponto de partida foi quando os autores detectaram alguns problemas no tratamento de falhas humanas no Reactor Safety Study (1975), a primeira Avaliação de Risco Probabilístico (em inglês, Probabilistic Risk Assessments - PRA) para Plantas Nucleares.
Estes problemas já tinham sido apontados e criticados pelo Lewis Report (1976). Todavia, o envolvimento dos autores nesta área só ocorreu após os esforços pioneiros de Swain, com a publicação da metodologia THERP, em 1983. Para Dougherty e Fragola, esta metodologia não mapeava de maneira correta as principais falhas humanas de risco significante. O acidente em Three Mile Island pareceu confirmar tais convicções.
Ao longo do livro, é apresentado o que é e como a Análise de Confiabilidade Humana é aplicada. Também, é explicado como incorporar falhas humanas em modelos PRA, e como separar sistematicamente as falhas humanas da magnitude dos seus riscos.
Os autores apresentam vários casos tomados da experiência na indústria nuclear.




Capítulo 1

As tecnologias atuais ganharam riscos que afetam e são afetados pelas ações realizadas por pessoas em situações normais (de operação corriqueira), de manutenção, e obviamente, de emergência. Os autores estimam a taxa de risco devido à ação humana em algumas indústrias:
o Indústria Nuclear: entre 50 e 70%;
o Indústria Petrolífera: 70%;
o Indústria da Aviação: 50%.

Embora pareça que o ser humano seja o culpado por toda a falha, já que foi o último envolvido na ação, esta falha começa mesmo no projeto de construção de um sistema tecnológico. O problema é que estas falhas de projeto e construção são numerosas e geralmente erroneamente entendidos como falhas do usuário. O fato é que certos componentes do sistema – como complexidade e perigos – podem colocar o usuário em situações em que não é possível realizar com sucesso algumas ações, como foi projeto. Os erros dos operadores em algumas tecnologias são forçados pela própria tecnologia e suas condições.
Assim, os autores concluem que o risco sempre terá um fator humano. Ademais, esta contribuição humana para o risco pode ser entendida, avaliada e quantificada aplicando-se técnicas da Análise de Confiabilidade Humana (Human Reliability Analysis – HRA). HRA é definida, então, como a probabilidade de que um conjunto de ações humanas sejam executadas com sucesso num tempo estabelecido ou numa determinada oportunidade.




Capítulo 2

Evolução Histórica
Para traçar uma evolução histórica, os autores apontam alguns acontecimentos importantes para o fortalecimento da HRA:
o Revolução Industrial (1760): raízes da HRA;
o A partir de 1950: a HRA como a ser encarada como disciplina. A engenharia industrial e a psicologia comportamental empreendem esforços para investigar as influências do ser humano na execução de tarefas;
o Entre 1961 e 1969: uma série de pesquisas, trabalhos e publicações trazem maturidade à engenharia de confiabilidade através da combinação de ferramentas organizacionais (da engenharia de sistemas) e ferramentas teóricas (da análise probabilística);
o 1964: Berliner desenvolve um trabalho no qual as tarefas são decompostas em elementos numa perspectiva comportamental, tornando possível a aplicação de análise de tarefas - embora não apresentasse melhorias na coleta de dados;
o 1964: Swain aperfeiçoa sua THERP (Technique for Human Error Rate Prediction – Técnica para Predição de Taxa de Erro Humano);
o 1979: o acidente em Three Miles Island chama a atenção para a energia nuclear, forçando esta indústria a reconhecer explicitamente a deficiência humana (fallibility - no sentido de fraqueza). O relatório da Presidente da Comissão diz que houve “ação inapropriada do operador”, resultantes de treianmento deficiente, falha no aprendizado em incidentes anteriores, e projeto da sala de controle inadequado (os autores informam que outros autores alegam ser injusto atribuir culpa aos operadores neste acidente);
o 1981: Rasmussen propõe um modelo que soluciona o problema da classificação do desempenho humano.
O acidente em Three Miles Island mostrou que as ações dos operadores podem propagar os efeitos de uma seqüência de acidentes. Sendo assim, deve-se dividir as considerações da HRA em PRA.
Os autores apontam que a HRA é uma disciplina em franco desenvolvimento, sendo aplicada em análise de riscos, análise de perigos, desenvolvimento de bancos de dados de experiências, e desenvolvimento de sistemas computacionais em geral. Na medida que a automação de processos de controle aumenta, crescem também os problemas relacionados ao erro humano.




Capítulo 3 – Questões Teóricas

Um dos principais empecilhos para a comunidade ligada à HRA é que não existe uma teoria do comportamento humano largamente aceita nas diversas ciências humanas e completa o suficiente para ser usada como base para a teoria da confiabilidade humana (devido ao fato de que o ser humano é uma entidade extremamente complexa por si só).
Todavia - conforme Rasmusse, Duncan e Leplat - a análise da confiabilidade humana é edificada sobre a idéia de que “a maior parte dos erros humanos constatados refletem muito mais a complexidade do ambiente do que a complexidade dos mecanismos psicológicos envolvidos”. Os erros previsíveis e a execução correta de atividades são dois lados da mesma moeda.
O cenário ideal para a HRA consiste em validar uma teoria para o comportamento humano que pudesse ser traduzida em um modelo de desempenho humano/sistema que então pudesse ser quantificado de maneira probabilística.Uma alternativa seria detectar teoricamente padrões significantes de falhas humanas e quantificar estes padrões com forte embasamento estatístico.
Em seguida, com vista a formar uma teoria da confiabilidade humana, os autores discorrem sobre alguns tópicos que devem ser levados em consideração, como:
o A natureza do cérebro/mente (a dicotomia desses dois termos);
o Lógica e arquitetura do comportamento;
o Relação com o mundo (“as pessoas vêem o que elas antecipam - ou adiantam - que verão”);
o Fenômeno “escolha” (“o comportamento humano é guiado por escolhas – a escolha de agir”);
o Tipos de comportamento (“segundo Rasmussen, existem dois tipos: habilidades e baseado em conhecimento”):
o Fenômeno emotivo (“as pessoas não tomam decisões rotineiramente, mas, sim, sob pressão”, “o stress do desempenho humano é mais interno do que externo”);
o Complexidade do mundo (“o mundo é dinâmico, guiado por eventos, formados por muitas partes integrantes, onde a evidência é incerta e as ações envolvem riscos como conseqüência”);
o Interações sociais (“as pessoas não agem e pensam de maneira harmoniosa”)


Um framework conceitual
Os autores apresentam um framework que apresenta o ser humano formado por vários módulos que conduzem a seleção de atividades: os módulos que percebem os vários aspectos do mundo (recognizers), os mecanismos de controle da ação (controllers), alguns especialistas (interpreters, choosers e planners), e o monitor (executive monitor), para controlar toda essa atividade cerebral.
Dessa forma, há que se considerar os tipos de comportamento de Rasmussen dentro do framework conceitual. Por exemplo, na indústria nuclear, as atividades de manutenção são baseadas em habilidades (know-how) enquanto que as atividades de diagnóstico de emergência são baseadas em conhecimento (know-why). As características de confiabilidade desses tipos diferentes de comportamentos também são diferentes.

Influências na confiabilidade humana
O desempenho dos equipamentos é influenciado pro fatores do ambiente, como temperatura. Os autores citam que a tripulação do Titanic, por acreditarem que não afundariam nunca, não tomaram as devidas precauções quanto à quantidade de botes salva-vidas, o procedimento normal.

Probabilidade
Desde que a confiabilidade está preocupada com eventos (sucesso e falhas), pode-se afirmar que é um conceito probabilístico. Dessa forma, os sucessos e falhas podem ser contabilizados pelo menos os efeitos observáveis.

Os autores concluem o capítulo justificando que as falhas são o preço pago pelos seres humanos pela diversidade e complexidade do seu comportamento. As pessoas são seres finitos, e os erros são a indicação disto. Os profissionais da HRA não pretendem eliminar a falha humana, mas entender as conseqüências e as causas de tais falhas e estimar as probabilidades de ocorrência.




Capítulo 4 – HRA como análise de confiabilidade

Neste capítulo, os autores discutem aspectos matemáticos e gerais dos dados utilizados em análises de confiabilidade humana. Inicialmente, são apresentadas semelhanças e diferenças entre análise de confiabilidade humana e análise de confiabilidade de equipamentos.
No desempenho de determinadas atividades, os equipamentos podem sofrer stress (a degradação causada supera a capacidade estrutural do equipamento) e shock (stresses que ocorrem de maneira muito rápida) devido à influência do ambiente hostil em que se encontram inseridos. Estes fenômenos ser inferidos e podem indicar a origem da falha, o que leva à possibilidade de mensurar o grau de confiabilidade matematicamente.
Os seres humanos também sofrem strees e shock ocasionados pelo ambiente. Sendo assim, algumas das atividades humanas podem ser simuladas, gerando um conjunto de dados para a HRA.
Em seguida, os autores apresentam várias fórmulas e mecanismos para modelar a ocorrência de falhas humanas ao longo do tempo (de maneira probabilística).




Capítulo 5 – Dados para HRA

As atividade de HRA são baseadas em conjuntos de dados em registros de falhas, que serão compilados, gerando dados maduros, que darão origem aos parâmetros estatísticos.. Este resultado é chamado de dados interpretados.
Uma ordem sugerida para modelar uma seqüência de acidentes é a seguinte:
o Identificar a seqüência a ser modelada;
o Escolher a equipe que executará a tarefa;
o Executar a tarefa, registrando tempos e ações;
o Realizar atividades pós-execução (para capturar alguma informação que tenha sido omitida durante a execução);
o Analisar dados.




Capítulo 6 – THERP

Os pensadores do THERP o conceberam a partir da análise de confiabilidade de equipamentos. Uma tarefa é um conjunto mínimo de ações humanas para atingir determinada meta. As ações são discretas. As ações em uma tarefa podem ser executadas por um indivíduo ou uma equipe (nesse caso, algumas ações podem ser executadas em paralelo). Algumas ações devem ser executadas numa ordem pré-estabelecida.






Capítulo 7 – HRA como parte da análise de risco

Um certo grau de incerteza pode ser associado a avaliações de risco. Esta incerteza surge da falta de conhecimento do fenômeno que está sendo investigado, da freqüência de ocorrência de alguns eventos, e do desempenho das pessoas e equipamentos envolvidos. A execução de uma análise de risco diminui este grau de incerteza de alguns elementos de risco, dessa forma, pode-se preocupar com outras áreas cujo risco exige maior atenção.
Sendo assim, a execução de uma análise de risco pode diminuir o risco, sem alterações no projeto, uma vez que pode-se identificar, caracterizar e (algumas vezes) quantificar o risco que de uma tecnologia ou de um fenômeno natural.
Uma análise de risco é composta por:
o Modelos de eventos;
o Modelos de conseqüências e efeitos dos eventos; e
o Técnicas e dados usados para entender e quantificar o risco em termos probabilísticos.




Capítulo 8– Procedimento de HRA

Pode-se identificar os seguintes passos para a execução de uma HRA:
o Integração de atividades;
o Atividades que realizam os quantificadores inicias;
o Atividades que realizam as análises detalhadas do evento.




Capítulo 9 – Análise qualitativa

Embora seja muito controversa, uma análise qualitativa de uma HRA numa PRA consiste em quatro tarefas:
o Familiarizar com a planta, seus procedimentos, políticas, operadores, instrumentação e controle, sistemas e modelos de PRA;
o Identificar os eventos de falha humana de risco significante;
o Incorporar os eventos dentro do modelo de PRA;
o Caracterizar os eventos.

Por sua vez, um evento de falha humana pode ser visto como um vetor de três conjuntos de informações:
o Caracterização mecânica do evento (tipo de falha, causas potenciais, etc);
o Especificação de interface do evento;
o Identificação das maiores influências na ocorrência do evento e avaliação da importância de cada influência.

Capítulo 10 – TRC – Time Reliability Correlation

O acidente em TMI deixou claro que em algumas situações os operadores não as falhas nem suas conseqüências a ponto de utilizar os procedimentos existentes. Foi reconhecido que se os operadores tivessem utilizado estes procedimentos eles teriam resolvido o problema sem perder a planta. A questão que surge é se um comportamento de risco significante ocorre fora do procedimento, e se pode ser considerado um método de HRA orientado a procedimento suficiente robusto para PRA.
A solução adotada pelo fundador do THERP e dos praticantes da HRA foi melhorar o método HRA baseado em análise de tarefas, que assim, passaria a incluir também os erros de tomada de decisão e diagnóstico (isto é, mistakes e slips – predominantes em atividades práticas ou altamente procedurais). Essa preocupação motivou o desenvolvimento de uma resposta quantitativa, a TRC (Time Reliability Correlation). Por sua vez, a indústria reagiu de maneira prática implementado uma nova filosofia para procedimentos de emergência.
A premissa básica de um método TRC se apóia na natureza fora do padrão de um evento e da exigência em cima do operador que precisa responder ao evento. A ocorrência de um evento fora do padrão:
o Força o operador da planta a responder reagir a condições fora do seu propósito ou intenção;
o Força o operador a diagnosticar um evento iminente;
o Força o operador a ter sucesso em suas ações, desde que o risco de falha gera perda de equipamentos, propriedades e até vidas.




Conclusão

Os autores admitem que o método apresentado no livro é especulativo. Todavia, enfatizam a importância das conclusões lógicas demonstradas no desenvolvimento de tecnologia para um programa de confiabilidade humana. Destacam ainda:
o A diferença entre erro humano e falha humana deve ser reconhecida e levada em consideração na avaliação de risco;;
o Os simuladores são os melhores recursos para gerar dados de acidente e eventos raros;
o A análise de eventos de falha humana (em seus modos, mecanismos e fatores causais) já é madura o bastante para guiar as atividades de gerenciamento de risco e programas de redução de erros.