ManageEngine está listado no Quadrante Mágico de 2022 da Gartner para ITSM. Leia o relatório completo
✕Última atualização: September 19, 2019
O gerenciamento de incidentes de TI é um dos processos fundamentais da assistência técnica. Neste guia, você aprenderá sobre os aspectos básicos do gerenciamento de incidentes, seus componentes, as funções e responsabilidades envolvidas e como o gerenciamento de incidentes funciona com outros componentes da central de atendimento.
Neste guia de gerenciamento de incidentes, discutiremos o seguinte:
Um incidente de TI é qualquer interrupção nos serviços de TI de uma organização que afeta qualquer coisa, seja um único usuário ou todo o negócio. Em suma, um incidente é qualquer coisa que interrompa a continuidade dos negócios.
O gerenciamento de incidentes é o processo de gerenciamento de interrupções nos serviços de TI e de restauração de serviços dentro dos contratos de nível de serviço (SLAs) acordados.
O escopo do gerenciamento de incidentes começa com um usuário final relatando um problema e termina com um membro da equipe da central de atendimento resolvendo esse problema.
Com a utilização do gerenciamento de incidentes ITIL adequado, coletar informações sobre incidentes é um processo simplificado e menos caótico, sem que e-mails sejam enviados e recebidos para esse fim. As equipes da central de atendimento podem publicar formulários no portal de autoatendimento do usuário para garantir que todas as informações relevantes sejam coletadas no momento da criação do tíquete.
A próxima etapa no gerenciamento de incidentes é a categorização e priorização de incidentes. Isso não só ajuda a classificar os tíquetes recebidos, mas também garante que os tíquetes sejam roteados para os técnicos mais qualificados para trabalhar no problema. A categorização de incidentes também ajuda o sistema de central de atendimento a aplicar os SLAs mais apropriados aos incidentes e a comunicar essas prioridades aos usuários finais. Quando um incidente é categorizado e priorizado, os técnicos podem diagnosticar o incidente e fornecer uma resolução ao usuário final.
O processo de gerenciamento de incidentes, quando habilitado com as automações relevantes, permite que as equipes da central de atendimento observem a conformidade com o SLA e enviem notificações aos técnicos quando estiverem lidando com uma violação do SLA; os técnicos também têm a opção de escalonar violações de SLA configurando escalonamentos automáticos, conforme aplicável ao incidente. Depois de diagnosticar o problema, o técnico oferece ao usuário final uma resolução, que pode ser validada. Esse processo de várias etapas garante que qualquer problema de TI que afete a continuidade dos negócios seja resolvido o quanto antes.
Incidentes em um ambiente de TI podem ser categorizados de várias maneiras diferentes. Alguns fatores que influenciam a categorização de incidentes incluem a urgência do incidente e a gravidade de seu impacto para os usuários ou para os negócios em geral. A classificação e categorização de incidentes de TI ajuda a identificar e rotear incidentes para o técnico certo, economizando tempo e esforço. Por exemplo, os incidentes podem ser classificados como incidentes maiores ou menores com base em seu impacto nos negócios e em sua urgência. Normalmente, os incidentes maiores são os que afetam os serviços essenciais ao negócio, afetando toda a organização, e precisam de resoluções imediatas. Os incidentes menores geralmente afetam um único usuário ou um departamento e podem ter uma resolução documentada já em vigor.
O gerenciamento de incidentes ITIL cobre todos os aspectos de um incidente em todo o seu ciclo de vida. Ele acelera o processo de resolução e torna o gerenciamento de tíquetes transparente. Sem o gerenciamento de incidentes, lidar com tíquetes pode ser um incômodo. Alguns dos principais problemas que podem surgir incluem:
Procurando agilizar o gerenciamento de incidentes na sua organização?
Agende uma demonstração do ServiceDesk PlusPráticas de gerenciamento de incidentes são amplamente utilizadas pelas equipes de central de atendimento de TI. As centrais de atendimento são geralmente o único ponto de contato para os usuários finais reportarem problemas às equipes de gerenciamento de TI.
O processo de gerenciamento de incidentes pode ser resumido da seguinte forma:
Ciclo de vida do gerenciamento de incidentes
Esses processos podem ser simples ou complexos com base no tipo de incidente; eles também podem incluir vários fluxos de trabalho e tarefas, além do processo básico descrito acima.
Um incidente pode ser registrado por meio de chamadas telefônicas, e-mails, SMS, formulários da web publicados no portal de autoatendimento ou por meio de mensagens do chat ao vivo.
Os incidentes podem ser categorizados e subcategorizados com base na área de TI ou de negócios em que o incidente causa uma interrupção, como rede, hardware, etc.
A prioridade de um incidente pode ser determinada em função do seu impacto e urgência usando uma matriz de prioridade. O impacto de um incidente denota o grau de dano que o problema causará ao usuário ou ao negócio. A urgência de um incidente indica o tempo em que o incidente deve ser resolvido. Com base na prioridade, os incidentes podem ser categorizados como:
Depois que o incidente é categorizado e priorizado, ele é automaticamente roteado para um técnico com o conhecimento relevante.
Com base na complexidade do incidente, ele pode ser dividido em subatividades ou tarefas. Normalmente, as tarefas são criadas quando uma resolução de incidentes requer a contribuição de vários técnicos de vários departamentos.
Enquanto o incidente está sendo processado, o técnico precisa garantir que o SLA não seja violado. Um SLA é o tempo aceitável dentro do qual um incidente precisa de resposta (SLA de resposta) ou resolução (SLA de resolução). Os SLAs podem ser atribuídos a incidentes com base em seus parâmetros como categoria, solicitante, impacto, urgência, etc. Nos casos em que um SLA está prestes a ser violado ou já foi violado, o incidente pode ser escalonado funcionalmente ou hierarquicamente para garantir que seja resolvido o quanto antes.
Um incidente é considerado resolvido quando o técnico apresenta uma solução temporária ou uma solução permanente para o problema.
Um incidente pode ser encerrado quando o problema é resolvido e o usuário reconhece a resolução e fica satisfeito com ela.
Depois do encerramento do incidente, é uma boa prática documentar todas as conclusões desse incidente. Isso ajuda a preparar melhor as equipes para futuros incidentes e cria um processo de gerenciamento de incidentes mais eficiente. O processo de revisão pós-incidente pode ser dividido em vários aspectos, como mostrado abaixo, e é particularmente útil para incidentes maiores.
Além dos fatores acima, alguns fatores de enfrentamento do usuário final também devem ser avaliados. Para esse propósito, uma pesquisa pós-encerramento é conduzida para coletar feedback dos usuários finais afetados pelo incidente. Essa pesquisa deve ser usada para obter insights em algumas áreas principais, como:
Crie fluxos de trabalho de gerenciamento de incidentes personalizados
Experimente o ServiceDesk Plus agoraEmbora cada organização possa ter suas próprias funções e responsabilidades personalizadas, abaixo estão algumas das funções mais comuns de gerenciamento de incidentes de TI.
Essa é a parte interessada que geralmente experimenta uma interrupção no serviço e gera um tíquete de incidente para iniciar o processo de gerenciamento de incidentes.
Este é o primeiro ponto de contato para os solicitantes quando eles querem gerar uma solicitação ou um tíquete de incidente. A central de atendimento de nível 1 geralmente consiste em técnicos que têm um conhecimento prático dos problemas mais comuns que podem ocorrer em um ambiente de TI, incluindo redefinições de senha e problemas de Wi-Fi.
Esta central de atendimento é composta por técnicos com conhecimentos avançados de gerenciamento de incidentes. Eles geralmente recebem solicitações mais complexas dos usuários finais; eles também recebem solicitações na forma de escalonamentos de nível 1.
Esse nível é geralmente composto por técnicos especializados que possuem conhecimento avançado de domínios específicos na infraestrutura de TI. Por exemplo, técnicos de manutenção de hardware e suporte de servidor especializados em campos muito específicos.
Essa parte interessada desempenha um papel fundamental no processo de gerenciamento de incidentes, monitorando a eficácia do processo, recomendando melhorias e garantindo que o processo seja seguido, entre outras responsabilidades.
Esta parte interessada possui o processo seguido para gerenciar incidentes. Eles também analisam, modificam e aprimoram o processo para garantir que ele atenda melhor ao interesse da organização.
Cada função tem responsabilidades exclusivas, conforme mostrado abaixo.
As métricas que impulsionam decisões importantes são denominadas principais indicadores de desempenho (KPIs). Abaixo estão alguns KPIs para o gerenciamento efetivo de incidentes de TI.
Tempo médio gasto para resolver um incidente.
Tempo médio gasto para responder cada incidente.
Porcentagem de incidentes resolvidos em um SLA.
Porcentagem de incidentes resolvidos na primeira chamada.
Número de incidentes idênticos registrados em um período de tempo específico.
Porcentagem de incidentes resolvidos que foram reabertos.
Número de incidentes pendentes na fila sem uma resolução.
Número de incidentes maiores em comparação com o número total de incidentes.
Despesa média referente a cada tíquete.
Número de usuários finais ou clientes que estavam satisfeitos com os serviços de TI fornecidos a eles.
Com um processo adequado de gerenciamento de incidentes da ITIL, você pode:
Ao escolher um sistema de tíquetes ou um software de assistência técnica de TI, há alguns recursos que podem realizar ou interromper o gerenciamento de incidentes de TI. Aqui estão alguns recursos a serem considerados ao escolher o software de gerenciamento de incidentes:
Obtenha seu próprio software de gerenciamento de incidentes compatível com a ITIL
Comece sua avaliação gratuita agoraO gerenciamento de incidentes é uma coleção de políticas, processos, fluxos de trabalho e documentação que ajuda as equipes de TI a gerenciar um incidente do início ao fim. O processo de gerenciamento de incidentes envolve a identificação de um incidente, registrando-o com todas as informações relevantes, diagnosticando o problema e restaurando o serviço de maneira oportuna. O processo de gerenciamento de incidentes é semelhante ao combate a incêndios, no qual o objetivo principal é minimizar os danos aos negócios.
Por outro lado, o gerenciamento de problemas de TI é o processo de identificar a causa raiz que leva a um ou mais incidentes e, em seguida, iniciar ações para corrigir o problema. O gerenciamento de problemas visa minimizar o impacto do problema nos negócios, adotando uma abordagem mais organizada na forma de análise de causa raiz, que é usada para identificar o problema subjacente. Este problema é então corrigido para evitar incidentes semelhantes no futuro. Por fim, identificar os problemas subjacentes ajuda no gerenciamento de incidentes e assegura proativamente que as operações normais continuem.
O gerenciamento de alterações da ITIL é o processo de modificar a infraestrutura de TI de uma organização de maneira padronizada e sistemática. É um processo bem planejado, composto por vários estágios e status pelos quais as alterações de TI podem passar.
Normalmente, as alterações de TI são iniciadas após os processos de gerenciamento de problemas de TI para corrigir o problema de TI identificado, substituir um ativo defeituoso que leva a incidentes repetidos ou como parte da resolução de um incidente maior. O objetivo do gerenciamento de incidentes de TI é minimizar as interrupções de TI e restaurar os serviços imediatamente. Em alguns casos, as implementações de alterações podem levar a incidentes, a maioria dos quais são incidentes menores causados por interrupções de serviço temporárias ou indisponibilidade do serviço. O impacto de tais incidentes pode ser minimizado informando proativamente os usuários finais sobre a implementação da alteração, bem como sobre incidentes previstos ou indisponibilidade do serviço. No caso de um incidente maior causado por uma alteração, as equipes de gerenciamento de alterações podem reverter imediatamente a alteração para restaurar a normalidade.
A integração do gerenciamento de ativos de TI e dos processos de gerenciamento de incidentes de TI torna o diagnóstico e a resolução de incidentes muito mais fáceis para os técnicos de nível 2 e de nível 3. Por exemplo, quando um usuário relata um problema sobre conectividade limitada à internet, o problema pode ser com o laptop ou com o roteador ao qual o usuário está conectado. Ter todas as informações sobre o laptop do usuário, incluindo o roteador ao qual ele está conectado, juntamente com seus detalhes e relações, ajuda o técnico a identificar a causa do incidente e fornecer a resolução correta. Do ponto de vista do gerenciamento de ativos, vincular incidentes de TI a ativos ajuda as centrais de atendimento de TI a identificar e retirar ativos com defeito que causam repetidos incidentes na organização.
Uma interrupção não planejada em um serviço de TI ou redução na qualidade de um serviço de TI. A falha de um item de configuração, mesmo que ainda não tenha afetado um serviço, também é um incidente (por exemplo, falha de um disco de um conjunto de espelhos).
O processo de descoberta do incidente.
Criar e manter um registro de um incidente na forma de um tíquete.
Registrar um incidente com a devida diligência para que ele seja colocado na categoria apropriada.
Encerrar um tíquete de incidente aberto quando o incidente for resolvido.
Um conjunto de regras que define a hierarquia para escalar incidentes, incluindo gatilhos que levam a escalonamentos. Os gatilhos geralmente têm base na gravidade do incidente e no tempo de resolução.
Gerenciamento do ciclo de vida de todos os incidentes para restaurar a operação normal do serviço o quanto antes e minimizar o impacto nos negócios.
Uma série de relatórios produzidos pelo gerenciador de incidentes para vários grupos-alvo (por exemplo, equipes responsáveis pelo gerenciamento de TI, pelo gerenciamento do nível de serviço, por outros processos de gerenciamento de serviços ou pelo próprio gerenciamento de incidentes).
A pessoa responsável pela implementação efetiva do processo de gerenciamento de incidentes e pela geração de relatórios. Também representa a primeira etapa de escalonamento se um incidente não puder ser resolvido dentro do nível de serviço acordado.
Contém as etapas predefinidas que devem ser seguidas para lidar com um tipo específico de incidente.
Acompanhamento do status de processamento dos incidentes pendentes, de modo que medidas preventivas possam ser introduzidas o quanto antes, caso os níveis de serviço possam ser violados.
Atribuição de prioridades aos incidentes e definição do que constitui um incidente maior.
Uma coleção de dados com todos os detalhes de um incidente, documentando o histórico do incidente desde o registro até o encerramento.
Um relatório que inclui informações sobre incidentes, como eles foram manipulados e outros dados que podem ajudar a medir o desempenho do processo de gerenciamento de incidentes.
A solução alternativa ou correção que corrige o incidente e restaura o serviço para sua melhor qualidade.
A posição em que um incidente está no processo de gerenciamento de incidentes. Os status comuns incluem:
Um pacote exclusivo de uma lista de verificação de recursos e apresentações de gerenciamento de incidentes.
Lista abrangente de recursos essenciais que você pode usar como referência para sua central de atendimento de TI.
Apresentações detalhadas com casos de uso específicos para iniciar o gerenciamento de incidentes da ITIL.
O principal produto da ManageEngine, o ServiceDesk Plus, é um software de central de atendimento da ITIL pronto para ser utilizado usado por profissionais de ITSM em todo o mundo. Com as melhores práticas de ITSM certificadas pelo setor, recursos fáceis de usar e aplicativos móveis nativos, o ServiceDesk Plus utiliza a mais recente tecnologia para ajudar as equipes de suporte de TI a fornecer serviços de classe mundial aos usuários finais com custos e complexidade reduzidos. Disponível nas versões de nuvem e no local, o software está disponível em três edições e 29 idiomas diferentes. Mais de 100.000 organizações em 185 países confiam no ServiceDesk Plus para otimizar o desempenho de sua central de atendimento de TI e estar prontas para o futuro em suas operações de gerenciamento de serviços de TI. Para mais informações sobre ServiceDesk Plus, visite manageengine.com/br/service-desk.
© 2019 Zoho Corp. All rights reserved.