O que é Problem Management?

Problem Management é um componente essencial da estrutura de ITSM: é o processo para identificar e gerenciar as causas raiz e possíveis incidentes de TI.

O Problem Management identifica e gerencia problemas usando métodos preventivos e identificando causas subjacentes para ajudar a evitar problemas futuros. Com um fluxo de trabalho estruturado para diagnosticar causas raiz e corrigir problemas, ele ajuda a eliminar incidentes recorrentes e minimizar os impactos de interrupções inesperadas. O Problem Management possibilita identificar a causa raiz dos problemas que afetam o serviço e também pode ajudar a evitar problemas antes que eles ocorram.

O Problem Management pode ter vários benefícios quando executado corretamente.

Melhoria contínua dos serviços

O tempo necessário para corrigir um problema pode impedir o desempenho de baixo nível e evitar outros problemas que possam interromper serviços no futuro. A integração perfeita entre os problemas e todos os outros processos de ITSM permite que as organizações reduzam proativamente os problemas e eliminem incidentes recorrentes.

Evitar incidentes dispendiosos

Incidentes como resultado de problemas podem custar muito tempo e dinheiro para uma organização se não forem gerenciados corretamente. Por outro lado, reduzir incidentes usando o gerenciamento eficaz de problemas economiza quantias significativas para as organizações, pois elimina grandes problemas antes que eles possam danificar serviços, produtos ou a reputação de uma empresa.

Aumentar a produtividade

Uma empresa pode ser mais produtiva se não gastar tempo e recursos respondendo a problemas que podem ser evitados.

Tempo de resolução reduzido

As práticas recomendadas relacionadas à análise de problemas ajudarão as equipes a responder com mais rapidez e precisão às interrupções do serviço e a evitar qualquer tempo de inatividade. Use a análise estruturada de problemas para correlacionar problemas e coordenar fluxos de trabalho para encontrar a maneira mais rápida de identificar a causa raiz.

Aprender com as causas subjacentes

As equipes podem aprender consistentemente com os incidentes quando praticam o gerenciamento de problemas de forma eficaz.

Aumentar a satisfação do cliente e do funcionário

Clientes e funcionários ficam mais satisfeitos quando há menos problemas ao longo do caminho. A paciência pode acabar se houver problemas, especialmente se os problemas forem sempre os mesmos.

Acelerar a restauração do serviço

Os serviços podem se beneficiar quando há visibilidade de erros conhecidos e soluções alternativas estabelecidas para a equipe de TI.

Minimizar interrupções de serviço

As equipes podem detectar problemas antes que eles evoluam para algo mais crítico, o que evita o tempo de inatividade e as interrupções do serviço. A TI pode usar proativamente painéis integrados para configurações e desempenho do serviço.

Acelerar a resolução da causa raiz

As equipes de TI podem criar análise estruturada de problemas, correlacionando problemas e coordenando fluxos de trabalho. Com uma visão consolidada dos incidentes e das mudanças relacionadas, a TI pode fornecer respostas e soluções mais rápidas.

Problem Management versus Knowledge Management

O gerenciamento do conhecimento é a criação de um repositório de documentação e soluções que incluem incidentes e problemas. O gerenciamento de conhecimento é utilizado para ajudar na solução de problemas. Quando um erro conhecido é documentado, um único clique gera um artigo de erros conhecidos na base de conhecimento, economizando tempo e esforço para corrigir problemas recorrentes no futuro.

Problem Management versus Incident Management

Os problemas são possíveis causas de um ou vários incidentes. Embora o gerenciamento de problemas e incidentes se sobreponha em algumas disciplinas, há diferenças importantes. Se uma implantação recente criar um lapso nos serviços, ela poderá ser revertida, o que resolve o incidente de interrupção do serviço. Mas, revertê-la não resolve o problema que causou o incidente. O problema subjacente ainda está presente.

O Incident Management tem um cronograma mais curto e o objetivo é, principalmente, resolver o incidente e devolver os serviços ao estado anterior. O Problem Management é um pouco mais complexo, podendo demorar mais, e procura identificar o que está sob um incidente, por que o incidente ocorreu e o que pode evitar que ele ocorra novamente.

Problem Management versus Change Management

O Change Management descreve um processo no qual as mudanças são planejadas, rastreadas e liberadas sem nenhuma interrupção do serviço. Caso uma mudança cause uma interrupção, ela será analisada durante um processo de gerenciamento de problemas. O Change Management fornece uma abordagem sistemática para controlar o ciclo de vida de todas as mudanças, facilitando a realização de mudanças benéficas com o mínimo de interrupção nos serviços de TI.

Detecção proativa de problemas

Identifique os problemas que podem ser corrigidos ou encontre soluções alternativas para esses problemas antes que os incidentes possam ocorrer.

Categorizar e priorizar

Mantenha as equipes organizadas e trabalhando nos problemas mais importantes, rastreando e avaliando os problemas conhecidos.

Processo de gerenciamento de problemas da ITIL

Investigar e diagnosticar

Identifique a causa do problema e descreva o melhor plano de ação possível para solucioná-lo.

Criar um registro de erros conhecidos

Registrar informações sobre problemas leva a menos tempo de inatividade caso um problema acione um incidente. A criação de um registro de erros pode manter informações sobre soluções alternativas prontamente disponíveis para reduzir o impacto de um incidente ou problema.

Criar uma solução alternativa, se necessário

Sempre considere soluções temporárias para reduzir o impacto dos problemas e trabalhe para evitar que eles se tornem incidentes. Embora as soluções alternativas não sejam ideais, elas podem limitar o impacto nos negócios caso surja um problema que não possa ser facilmente identificado.

Resolver e encerrar o problema

Um problema fechado foi eliminado e não causará outro incidente.

Revisão de problema grave

Reserve um tempo para analisar a resolução de um problema e assegure que o problema tenha sido totalmente eliminado. Registre as lições aprendidas e identifique as ações preventivas que devem ser tomadas caso o problema ocorra novamente.

Não confie na análise reativa da causa raiz

Normalmente, não existe uma única causa por trás de um problema. As equipes devem considerar todos os fatores possíveis e não apenas identificar um único fator de forma reativa.

Incentive um ambiente aberto em que os problemas sejam compartilhados

Os membros da equipe devem sempre ter uma conversa aberta em que sejam encorajados a compartilhar descobertas e fatos sem punição ou represália.

Foco nos serviços essenciais

Aborde os problemas que afetam os serviços que oferecem mais valor à organização e priorize-os em vez de problemas menores.

Faça perguntas

Promova um ambiente em que os membros da equipe façam perguntas uns aos outros e aos sistemas.

Espalhe conhecimento

As equipes devem sempre compartilhar o conhecimento entre si e, com sorte, outras equipes podem aprender com elas.

Promova a aprendizagem

O gerenciamento de problemas nunca termina, mesmo para as equipes de melhor desempenho. As equipes devem estar constantemente aprendendo, repetindo processos e melhorando-os para garantir que os problemas tenham um impacto menor sobre os clientes e outras equipes.

Rastreie o acompanhamento

Desenvolva um método padronizado para manter o controle dos acompanhamentos. Utilize software que possa ajudar os membros da equipe a priorizar tarefas, rastrear o progresso e acompanhar os problemas.

Brainstorm

Reúna as partes interessadas em um único local e discuta as possíveis causas de um problema. Esse é um bom método para as equipes eliminarem quaisquer silos possíveis. O brainstorm envolve:

  • Discussões round-robin
  • Um volume maior de ideias em um curto espaço de tempo
  • Geração de ideias diversificadas
  • Participação total de cada indivíduo à medida que contribuem para a análise do problema.

Ishikawa/Fishbone/Análise de causa e efeito

Uma causa e um efeito são um problema e suas possíveis causas. Este método analisa as causas e define suas relações com os efeitos. Envolve as causas primárias e secundárias de um problema e suas diferentes categorias, como pessoas, processos, produtos etc.

Análise de problemas Kepner Tregoe

Uma abordagem mais lógica que começa com a identificação do problema e, em seguida, a descrição. As causas são estabelecidas, os testes são conduzidos, e então a causa do problema é identificada e verificada.

Erros conhecidos

Um problema documentado com uma causa raiz conhecida e uma solução alternativa.

KEDB (Banco de dados de erros conhecidos)

Criado pelo gerenciamento de problemas e aplicado para gerenciar erros conhecidos.

Problema

Uma causa de um ou mais incidentes. Quando um registro de problema é criado, a causa do problema geralmente não é conhecida.

Relatório de gerenciamento de problemas

Um relatório que fornece informações sobre problemas a outros processos de gerenciamento de serviços.

Registro de problema

Contém todos os detalhes de um problema e documenta o histórico dele desde a detecção inicial até a resolução.

Novo erro conhecido sugerido

Uma sugestão da criação de uma nova entrada no KEDB.

Novo problema sugerido

Uma notificação que alerta os funcionários sobre um problema suspeito que pode levar a uma investigação mais aprofundada.

Nova solução alternativa sugerida

As sugestões para adicionar uma nova solução alternativa ao KEDB.

Solução alternativa

Uma solução para um problema que deve ser temporário e que deve eliminar o impacto de um erro ou problema conhecido quando uma resolução ainda não está disponível. As soluções alternativas tendem a minimizar o impacto de incidentes e problemas quando a causa não pode ser identificada.

Problem Management é uma abordagem projetada para gerenciar com eficiência os ciclos de vida de problemas atuais e potenciais. O objetivo do Problem Management é eliminar incidentes recorrentes, evitar incidentes futuros e minimizar o impacto de incidentes que não podem ser evitados. Isso envolve o diagnóstico das causas raiz e a discussão das etapas adequadas para resolver o problema. Além disso, o Problem Management foi projetado para melhorar a eficácia ao longo do tempo, registrando dados relevantes associados a problemas e atuando como um banco de dados de soluções e soluções alternativas eficazes.

A ServiceNow traz fluxos de trabalho automatizados para o gerenciamento de problemas, permitindo que os gerentes documentem com precisão as soluções e liberando as equipes de TI para se concentrarem em outras preocupações relevantes. Quando ocorrerem problemas inesperados, restaure serviços rapidamente usando fluxos de trabalho estruturados para identificar e corrigir facilmente as causas raiz, documentar soluções e resoluções e fornecer às equipes de TI uma visão consolidada de incidentes, tudo a partir de uma única plataforma baseada em nuvem.

O resultado final? Redução de interrupções de serviço, análise de problemas aprimorada e menos impactos causados por problemas ao longo do tempo.

Ao fornecer uma visão totalmente consolidada de causas, incidentes, problemas e mudanças, as organizações podem fornecer respostas mais rápidas e soluções mais ágeis e eficientes. A ServiceNow torna tudo isso possível.

Comece a usar o Problem Management

O ServiceNow® Problem Management possibilita minimizar interrupções, agilizar o serviço e acelerar a resolução da causa raiz.