O que é gerenciamento de incidentes?

O gerenciamento de incidentes é uma série de etapas executadas para identificar, analisar e resolver incidentes críticos que podem levar a problemas em uma organização se não forem restaurados.

O Incident Management restaura a operação normal do serviço, minimizando o impacto nas operações de negócios e mantendo a qualidade.

Um incidente, por definição, é uma ocorrência que pode interromper ou causar uma perda de operações, serviços ou funções. O gerenciamento de incidentes descreve as ações que precisam ser realizadas por uma organização para analisar, identificar e corrigir problemas enquanto adota medidas que podem impedir incidentes futuros.

Os incidentes podem interromper as operações, levar a tempo de inatividade temporário e contribuir para a perda de dados e de produtividade. É cada vez mais crucial que as organizações levem a sério as práticas de gerenciamento de incidentes, já que há vários benefícios.

Alguns desses benefícios incluem:

Melhor eficiência e produtividade

Pode haver práticas e procedimentos estabelecidos que ajudam as equipes de TI a responder melhor e a atenuar incidentes futuros. Além disso, o aprendizado de máquina atribui automaticamente incidentes aos grupos certos para uma resolução mais rápida. Os portais de agente dedicados para resolução de problemas têm acesso a todas as informações necessárias em uma única exibição e podem aproveitar a IA para fornecer soluções recomendadas imediatamente. Um portal dedicado para o gerenciamento de incidentes principais permite uma resolução rápida, reunindo as equipes certas de resolução e as partes interessadas para restaurar os serviços.

Visibilidade e transparência

Os funcionários podem facilmente entrar em contato com o suporte de TI para rastrear e corrigir problemas. Eles podem se conectar à TI por meio da Web ou do celular para ter uma melhor compreensão do status de seus incidentes do início ao fim e efeitos subsequentes. Uma melhor experiência do consumidor é fornecida por meio de autoatendimento omnicanal intuitivo e comunicações bidirecionais transparentes.

Nível mais alto de qualidade de serviço

Os agentes têm a capacidade de priorizar incidentes com base em processos estabelecidos, que também podem ajudar na continuidade dos processos de negócios, reunidos para gerenciar o trabalho e colaborar usando uma plataforma única para processos de TI. Da mesma forma, o gerenciamento de incidentes torna possível restaurar serviços rapidamente, reunindo os agentes certos para gerenciar o trabalho e colaborar usando uma plataforma única para processos de TI. A TI pode usar aprendizado de máquina avançado e modelos de dados para categorizar e atribuir incidentes automaticamente, aprendendo com padrões em dados históricos.

Mais informações sobre a qualidade do serviço

Os incidentes podem ser registrados no software de gerenciamento de incidentes, que fornece informações do tempo de serviço, da gravidade do incidente e se há ou não um tipo constante de incidente que pode ser atenuado. A partir daqui, o software pode gerar relatórios para visibilidade e análise.

SLAs (acordos de nível de serviço)

Os sistemas de gerenciamento de incidentes ajudam a criar processos que fornecem informações sobre SLAs e se eles estão ou não sendo atendidos.

Prevenção de incidentes

Depois que os incidentes são identificados e atenuados, o conhecimento desses incidentes e as respostas necessárias podem ser aplicados a incidentes futuros para uma resolução mais rápida ou prevenção total. Aumente a taxa de desvio de incidentes reduzindo tíquetes e volumes de chamadas usando os portais de autoatendimento e os chatbots da ServiceNow. Os funcionários podem encontrar respostas por conta própria sem ter que registrar um incidente, evitando problemas com eficiência antes que eles afetem os usuários com o AIOps.

MTTR (tempo médio para resolução) aprimorado

O tempo médio para resolução diminui quando há processos documentados e dados de incidentes passados. Acelere a resolução de incidentes com aprendizado de máquina e ajuda contextual para eliminar gargalos. A integração do AIOps reduz incidentes e o MTTR (tempo médio para resolução) para eliminar ruídos, priorizar e corrigir.

Redução ou eliminação do tempo de inatividade

Os incidentes causam tempo de inatividade, o que pode retardar ou impedir as empresas de executar operações e serviços. Processos bem documentados de gerenciamento de incidentes ajudam na redução ou eliminação total do tempo de inatividade que ocorre como resultado de um incidente.

Melhoria da experiência do cliente e do funcionário

Operações estáveis em uma empresa se refletem nos produtos ou serviços. Os clientes terão uma experiência melhor se as empresas não enfrentarem tempo de inatividade ou lapsos nos serviços por causa de um incidente. Da mesma forma, fornecendo opções omnicanal, nas quais os funcionários podem enviar incidentes por meio de portais de autoatendimento, chatbots, e-mail, telefone ou celular, permite que eles entrem em contato facilmente com o suporte para rastrear e corrigir problemas com o gerenciamento de incidentes.

Registro de incidentes

Um incidente é identificado e registrado nos relatórios do usuário e pelo uso de análises de solução. Uma vez identificado, o incidente é registrado e categorizado. Isso é importante para priorizar incidentes e saber como tratar os incidentes futuros.

Notificação e escalonamento

O tempo desta etapa pode variar de incidente para incidente, dependendo da categorização do incidente. Incidentes menores também podem ser registrados e confirmados sem acionar um alerta oficial. O escalonamento ocorre quando um incidente dispara um alerta e os procedimentos adequados são realizados pelo indivíduo designado para gerenciar o alerta.

Gráfico que mostra os diferentes aspectos do gerenciamento de incidentes.

Classificação do incidente

Os incidentes precisam ser classificados na categoria e subcategoria adequadas para serem facilmente identificados e tratados. Normalmente, a classificação acontece automaticamente quando os campos certos são configurados para classificação, a priorização é atribuída com base na classificação e os relatórios são gerados rapidamente.

Priorização de incidentes

A prioridade adequada pode ter um impacto direto no SLA de uma resposta do incidente, garantindo que os problemas mais críticos para os negócios sejam resolvidos no prazo e nem os clientes nem os funcionários tenham qualquer lapso no serviço.

Investigação e diagnóstico

A equipe de TI realiza uma análise e fornece uma solução para o funcionário assim que um incidente é gerado. Se uma resolução não estiver imediatamente disponível, o incidente será encaminhado para as equipes apropriadas para investigação e diagnóstico adicionais do incidente.

Resolução e fechamento de incidentes

Uma equipe de TI é destinada a resolver incidentes usando os métodos de priorização adequados o mais rápido possível. A comunicação pode ajudar com a resolução e o encerramento de tíquetes, com a possibilidade de automação para ajudar a resolvê-los. Depois que um incidente é resolvido, há mais registro e entendimento de como evitar que ele ocorra novamente ou diminuir o tempo de resolução.

Registre tudo

Não importa o nível do incidente, a urgência ou a posição do chamador, sempre conecte tudo em uma única ferramenta com o máximo de detalhes possível. Acompanhe todos os incidentes, isso acelera o tempo de resposta e resolução. Há também sistemas automatizados que podem reconciliar os registros.

Preencha tudo

Seja meticuloso no preenchimento de tudo para garantir que seja detalhado para qualquer investigação posterior, coleta de informações ou relatórios gerados.

Mantenha suas categorizações claras

Evite categorias e subcategorias desnecessárias que possam ser classificadas em outro lugar ou descritas nos campos. Também evite ao máximo usar opções como "outro".

Mantenha uma equipe bem atualizada

Padronize processos para garantir que cada membro da equipe siga os mesmos procedimentos e utilize as respostas certas para cada incidente, o que mantém a qualidade consistente e uniforme.

Registre e use soluções padrão

As soluções nem sempre precisam ser novas e inovadoras. Se houver soluções eficazes existentes, use-as para manter padronizados os procedimentos em andamento.

Ofereça suporte a funcionários

Há um benefício organizacional significativo por treinar funcionários de forma adequada e consistente em todos os níveis. Pode ser benéfico treinar pessoal que não é de TI sobre como responder a incidentes em determinados níveis para ajudar a equipe de TI a acelerar a resposta aos incidentes de nível mais alto. As equipes que são bem treinadas também são mais eficazes juntas e se comunicam melhor.

Defina alertas importantes

Um dos aspectos mais importantes do gerenciamento de incidentes é evitar sobrecarga desnecessária. Planeje cuidadosamente como os eventos são categorizados e o que essas categorias significam para evitar que os incidentes sejam ignorados e que os tempos de resposta sejam muito demorados.

Um bom ponto de partida é definir indicadores de nível de serviço que sejam usados para determinar a hierarquia das priorizações, por exemplo, priorizar a análise de causa raiz sobre os sintomas superficiais.

Prepare sua equipe para o plantão

As equipes precisam comunicar quando e quem está supervisionando os incidentes. Crie uma programação de plantão para ajudar a garantir que um respondedor com a experiência adequada esteja disponível no caso de um incidente e faça todos os ajustes com base na sobrecarga individual dos funcionários em relação a diferentes incidentes.

Estabelecer diretrizes de comunicação

Crie diretrizes para estabelecer uma comunicação eficaz. Isso é crucial para a colaboração e a eficácia da equipe. As diretrizes devem estabelecer que canais a equipe deve usar, o conteúdo desses canais e como a comunicação deve ser documentada.

Diretrizes inadequadas podem criar estresse e tensão desnecessários durante os períodos de resposta, quando não há um padrão de como os funcionários devem interagir e se comunicar. As comunicações bem documentadas ajudam as equipes a consultarem-se para verificar a comunicação e transmitir os detalhes necessários sem perda de informações.

Simplifique o processo de mudança

Estabeleça níveis ou tipos de alterações que os indivíduos podem fazer e de quem eles precisam obter aprovação. Dependendo do sistema e do indivíduo, eles podem precisar buscar aprovação ou confirmação adicional para alterações. Verifique se o conselho que supervisiona as mudanças está prontamente disponível para que os procedimentos sejam rápidos e eficazes.

Melhore os sistemas com as lições aprendidas

Revise os incidentes e avalie o motivo deles. Identifique as medidas preventivas que poderiam ter sido tomadas e as medidas que precisam ser tomadas para os incidentes futuros. Isso também garante que toda a documentação seja preenchida e que haja treinamento adequado de responsabilidade e conformidade, se necessário.

Um problema é uma série de incidentes que não têm uma causa raiz conhecida. Um incidente é um evento que faz com que algo pare de funcionar da forma ideal. O gerenciamento de problemas possibilita identificar a causa raiz de um problema que esteja afetando seus serviços e pode ajudar você, antes de tudo, a evitar que os problemas aconteçam, ao passo que o gerenciamento de incidentes é uma abordagem reativa a algo de curto prazo que dá errado. Um incidente permite que os sistemas continuem sendo executados, mas um incidente gerenciado pode não necessariamente resolver um problema, que tende a ser de mais longo prazo.

Os incidentes são resultado de algo que não está funcionando ou de um problema que precisa de resolução, o que aciona os processos de gerenciamento de incidentes. Uma solicitação se assemelha mais a algo, como um serviço, que é necessário para o funcionário, como acesso, itens, equipamentos etc.

  • Configurar processos para atender aos requisitos dos negócios
  • Respeitar os processos e cumprir os SLAs
  • Gerenciar equipes em diferentes níveis
  • Gerar relatórios e manter KPIs (principais indicadores de desempenho)
  • Ser um ponto de escalonamento quando um incidente principal precisar ser resolvido
  • Coordenar com outras equipes

O ServiceNow Incident Management pode ajudar a manter os funcionários produtivos e felizes, garantindo um suporte de contato fácil de usar para rastrear e corrigir problemas. Os usuários podem se conectar à TI por meio do portal de autoatendimento, chatbot, e-mail, telefone ou celular.

Os agentes de TI também ficarão entusiasmados. Os sistemas de aprendizado de máquina atribuem automaticamente incidentes ao grupo de resolução certo para uma resolução mais rápida e eficaz. Os portais de agentes dedicados para resolução de problemas têm todas as informações necessárias em uma única exibição e aproveitam a IA para fornecer soluções recomendadas imediatamente. Há também um portal dedicado para o gerenciamento de incidentes principais que permite uma resolução rápida, reunindo as equipes de resolução e as partes interessadas certas para restaurar os serviços. O Mobile Agent dá aos agentes de TI uma interface móvel para fazer a triagem, direcionar e resolver incidentes onde estiverem.

Além disso, o ServiceNow Incident Management oferece suporte 24 horas por dia, integra-se perfeitamente com o AIOps, permite que os funcionários usem a notificação omnicanal para enviar incidentes e oferece à equipe de service desk uma visão clara dos fluxos de trabalho de resolução de incidentes por meio de um playbook de resposta a incidentes. Os Visual Task Boards promovem uma colaboração intuitiva e eficaz, e o CMDB (Configuration Management Database) cria um sistema único de registro para ajudar os usuários a entender melhor os impactos associados a incidentes individuais, problemas e solicitações de mudança.

E, com a configuração guiada, implantar o ServiceNow Incident Management é um processo rápido e simples.

Restaure serviços rapidamente

Permita que os agentes gerenciem e colaborem no trabalho com uma plataforma única de processos de TI.

Impulsione a produtividade dos funcionários

Capacite os funcionários para fazerem mais, com autoatendimento omnicanal e comunicação bidirecional.

Aumente o desvio de incidente

Forneça portais de autoatendimento e chatbots inteligentes, para que os usuários tenham os recursos para resolver seus próprios problemas sem ter que envolver a TI.

Turbine a produtividade do agente

Incorpore o aprendizado de máquina para garantir que os incidentes certos sejam atribuídos aos grupos certos e consiga uma resolução mais rápida e completa.

Conheça melhor o ServiceNow ITSM

Libere sua inovação com uma solução moderna de ITSM com redução de silos e baseada na nuvem.