# O que é gerenciamento de incidente de TI?

![O que é gerenciamento de incidente de TI](https://www.manageengine.com/products/service-desk/it-incident-management/images/guide-for-it-incident-management-guide.png)

O guia definitivo para o gerenciamento de incidentes de TI

O gerenciamento de incidentes de TI é um dos processos fundamentais da central de ajuda. Neste guia, você conhecerá os conceitos básicos do gerenciamento de incidentes, seus componentes, as funções e responsabilidades envolvidas e como ele funciona com outros componentes da central de serviços.

Neste guia de gerenciamento de incidentes, discutiremos o seguinte:

1. [Definição de incidente](https://www.manageengine.com/br/service-desk/it-incident-management/what-is-it-incident-management.html#definitions)
2. [Ciclo de vida/fluxo de processos do gerenciamento de incidentes de TI](https://www.manageengine.com/br/service-desk/it-incident-management/what-is-it-incident-management.html#workflow)
3. [Funções e responsabilidades do gerenciamento de incidentes](https://www.manageengine.com/br/service-desk/it-incident-management/what-is-it-incident-management.html#roles)
4. [Práticas recomendadas de gerenciamento de incidentes](https://www.manageengine.com/br/service-desk/it-incident-management/what-is-it-incident-management.html#best-practices)
5. [Benefícios e vantagens do gerenciamento de incidentes](https://www.manageengine.com/products/service-desk/it-incident-management/incident-benefits-feature-checklist.html#benefits)
6. [Lista de verificação dos recursos do software de gerenciamento de incidentes](https://www.manageengine.com/products/service-desk/it-incident-management/incident-benefits-feature-checklist.html#checklist)
7. [KPIs de gerenciamento de incidentes](https://www.manageengine.com/products/service-desk/it-incident-management/incident-management-kpis-metrics.html)
8. [Diferença entre incidente, problema, mudança e ativo](https://www.manageengine.com/products/service-desk/it-incident-management/incident-vs-problem-vs-change-vs-asset-management.html)
9. [Glossário ITSM para gerenciamento de incidentes](https://www.manageengine.com/products/service-desk/it-incident-management/it-incident-glossary-terms.html)
10. [Baixe o kit de ferramentas de autoavaliação](https://www.manageengine.com/br/service-desk/it-incident-management/what-is-it-incident-management.html#form)

## Definição de incidente de TI

![What is incident management in IT](https://www.manageengine.com/products/service-desk/it-incident-management/images/what-is-it-incident-management.png)

### O que é um incidente de TI?

Um incidente de TI é qualquer interrupção nos serviços de TI de uma organização que afete um único usuário ou toda a empresa. Em resumo, um incidente é qualquer coisa que interrompa a continuidade dos negócios.

### O que é gerenciamento de incidentes de TI?

O gerenciamento de incidentes é o processo de gerenciar as interrupções dos serviços de TI e os restaurar dentro dos acordos de nível de serviço (SLAs) acordados.

O escopo do gerenciamento de incidentes começa com um usuário final que relata um problema e termina com um membro da equipe da central de serviços que resolve esse problema.

### As etapas do gerenciamento de incidentes

Com o gerenciamento adequado de incidentes em vigor, a coleta de informações sobre incidentes é simplificada e menos caótica, sem a necessidade de ficar enviando e recebendo e-mails para esse fim. As equipes de central de serviços podem publicar formulários no [portal de autoatendimento](https://www.manageengine.com/br/service-desk/self-service/what-is-it-self-service-portal-examples.html) do usuário para garantir que todas as informações relevantes sejam coletadas no momento da criação do ticket.

A próxima etapa do gerenciamento de incidentes é a categorização e a priorização dos incidentes. Isso não apenas ajuda a classificar os tickets recebidos, mas também garante que os tickets sejam encaminhados aos técnicos mais qualificados para trabalhar no problema. A categorização de incidentes também ajuda o sistema de central de serviços a aplicar os SLAs mais adequados e a comunicar essas prioridades aos usuários finais. Depois que um incidente é categorizado e priorizado, os técnicos podem diagnosticar o incidente e fornecer uma solução ao usuário final.

O processo de gerenciamento de incidentes, quando ativado com as automações relevantes, permite que as equipes da central de serviços fiquem de olho na conformidade com o SLA e [envia notificações](https://www.manageengine.com/br/service-desk/automation/email-notification-rules.html) aos técnicos quando eles estão se aproximando de uma violação. Os técnicos também têm a opção de escalonar as violações do SLA configurando escalonamentos automatizados, conforme aplicável ao incidente. Depois de diagnosticar o problema, o técnico oferece ao usuário final uma solução, que ele pode validar. Esse processo de várias etapas garante que qualquer problema de TI que afete a continuidade dos negócios seja resolvido o mais rápido possível.

### Como classificar os incidentes de TI

Os incidentes em um ambiente de TI podem ser categorizados de várias maneiras diferentes. Alguns fatores que influenciam a categorização de incidentes incluem a urgência do incidente e a gravidade de seu impacto sobre os usuários ou a empresa em geral.

A classificação e a categorização de incidentes de TI ajudam a identificar e encaminhar os incidentes para o técnico certo, economizando tempo e esforço. Por exemplo, os incidentes podem ser classificados como incidentes maiores ou menores com base em seu impacto nos negócios e em sua urgência.

Normalmente, os incidentes maiores são aqueles que afetam os serviços essenciais aos negócios, afetando, portanto, toda a organização, e precisam de resoluções imediatas. Os menores geralmente afetam um único usuário ou um departamento e podem já ter uma resolução documentada em vigor.

### O que acontece quando você não tem um gerenciamento de incidentes de TI implementado?

O gerenciamento de incidentes abrange todos os aspectos de um incidente em seu ciclo de vida. Ele acelera o processo de resolução e torna o [gerenciamento de tickets](https://www.manageengine.com/br/service-desk/help-desk-software/it-helpdesk-ticketing-system.html) transparente. Sem o gerenciamento de incidentes, lidar com chamados pode ser um incômodo. Alguns dos principais problemas que podem surgir incluem:

- Falta de transparência no status do ticket e nos prazos esperados para os usuários finais.
- Nenhum registro adequado de incidentes anteriores.
- Incapacidade de documentar soluções para problemas repetidos ou familiares.
- Maior risco de interrupções nos negócios, principalmente com incidentes graves.
- Tempos de resolução estendidos
- Falta de capacidade de geração de relatórios.
- Diminuição da satisfação do cliente

### Quem usa o gerenciamento de incidentes de TI?

As práticas de gerenciamento de incidentes são amplamente utilizadas pelas equipes da central de serviços de TI. As centrais de serviços geralmente são o único ponto de contato dos usuários finais para relatar problemas às equipes de gerenciamento de TI.

## O ciclo de vida do gerenciamento de incidentes de TI

![IT incident management process steps](https://www.manageengine.com/products/service-desk/it-incident-management/images/incident-management-process.png)

O processo de gerenciamento de incidentes pode ser resumido da seguinte forma:

- **Etapa 1 :** Registro de incidentes.
- **Etapa 2 :** Categorização de incidentes.
- **Etapa 3 :** Priorização de incidentes.
- **Etapa 4 :** Atribuição de incidentes.
- **Etapa 5 :** Criação e gerenciamento de tarefas.
- **Etapa 6 :** Escalonamento e [gerenciamento de SLA](https://www.manageengine.com/br/service-desk/automation/sla-management.html).
- **Etapa 7 :** Resolução de incidentes.
- **Etapa 8 :** Encerramento do incidente.

![Fluxo com 6 etapas do gerenciamento do ciclo de vida de um incidente](https://cdn.manageengine.com/sites/meweb/images/br/service-desk/images/incident-workflow-diagram.jpg)

Esses processos podem ser simples ou complexos com base no tipo de incidente. Eles também podem incluir vários fluxos de trabalho e tarefas além do processo básico descrito acima.

### Registro de incidentes

Um incidente pode ser registrado por meio de chamadas telefônicas, e-mails, SMS, formulários da Web publicados no [portal de autoatendimento](https://www.manageengine.com/products/service-desk/self-service/it-helpdesk-self-service-portal.html) ou por meio de [mensagens de chat online](https://www.manageengine.com/br/service-desk/self-service/help-desk-live-chat-software.html).

### Categorização de incidentes

Os incidentes podem ser categorizados e subcategorizados com base na área de TI ou de negócios em que o incidente causa uma interrupção, como rede, hardware etc.

### Priorização de incidentes

A prioridade de um incidente pode ser determinada como uma função de seu impacto e urgência usando uma matriz de prioridade. O impacto de um incidente indica o grau de dano que o problema causará ao usuário ou à empresa. A urgência indica o tempo em que o incidente deve ser resolvido. Com base na prioridade, os incidentes podem ser categorizados como:

- Crítico
- Alta
- Média
- Baixa

### Encaminhamento e atribuição de incidentes

Depois que o incidente é categorizado e priorizado, ele é encaminhado automaticamente para um técnico com a experiência relevante.

### Criação e gerenciamento de tarefas

Com base na complexidade do incidente, ele pode ser dividido em subatividades ou tarefas. Normalmente, as tarefas são criadas quando a resolução de um incidente exige a contribuição de vários técnicos de vários departamentos.

### Escalonamento e gerenciamento de SLA

Enquanto o incidente está sendo processado, o técnico precisa garantir que o SLA não seja violado. Um SLA é o tempo aceitável dentro do qual um incidente precisa de resposta (SLA de resposta) ou resolução (SLA de resolução). Os SLAs podem ser atribuídos a incidentes com base em seus parâmetros, como categoria, solicitante, impacto, urgência, etc. Nos casos em que um SLA está prestes a ser violado ou já foi violado, o incidente pode ser escalado funcional ou hierarquicamente para garantir que seja resolvido o mais rápido possível.

### Resolução de incidentes

Um incidente é considerado resolvido quando o técnico apresenta uma alternativa temporária ou uma solução permanente para o problema.

### Encerramento do incidente

Um incidente pode ser encerrado quando o problema for resolvido e o usuário reconhecer a resolução e estiver satisfeito com ela.

### Revisão pós-incidente

Após o encerramento de um incidente, é uma boa prática documentar todas as suas conclusões. Isso ajuda a preparar melhor as equipes para futuros incidentes e cria um processo de gerenciamento de incidentes mais eficiente. O processo de revisão pós-incidente pode ser dividido em vários aspectos, conforme mostrado abaixo, e é particularmente útil para incidentes graves.

### Avaliação interna

#### Identificação do incidente

- Quem detectou o incidente e como?
- Em quanto tempo o incidente foi detectado após sua ocorrência?
- O incidente poderia ter sido identificado antes?
- Alguma ferramenta ou tecnologia poderia ter ajudado na detecção imediata ou preventiva do incidente?

#### Fluxo de informações e comunicação

- Com que rapidez as partes interessadas foram informadas sobre o incidente?
- Que canal foi usado para transmitir as notificações?
- Todas as partes interessadas relevantes foram prontamente atualizadas com as informações mais recentes?
- Qual foi a facilidade de comunicação com o(s) usuário(s) final(is) para coletar informações e mantê-lo(s) informado(s) sobre o status do ticket?

#### Estrutura

- Como a [equipe de resposta a incidentes](https://www.manageengine.com/br/service-desk/it-incident-management/what-is-incident-response.html) foi estruturada inicialmente?
- Essa estrutura foi mantida durante todo o ciclo de vida do gerenciamento de incidentes? Se não, por quê? Que mudanças tiveram de ser feitas na estrutura?
- A equipe de tratamento de incidentes pode ser organizada de uma maneira melhor? Em caso afirmativo, como?

#### Utilização de recursos

- Quais recursos foram empregados para lidar com o incidente?
- Esses recursos foram usados em sua capacidade ideal?
- Com que rapidez os recursos foram mobilizados para lidar com o incidente?
- A utilização de recursos poderia ser melhorada no futuro?

#### Processo

- O processo de gerenciamento de incidentes definido foi seguido à risca?
- Houve algum desvio no fluxo de trabalho e no processo de gerenciamento de incidentes?
- Os SLAs do incidente foram cumpridos? Caso contrário, quais SLAs foram violados? Por quê?
- Houve monitoramento adequado do processo que está sendo seguido para lidar com o incidente?
- O processo poderia ser aprimorado para torná-lo mais eficiente? Em caso afirmativo, como?

#### Relatórios

- Foram gerados relatórios para analisar como o incidente foi tratado?
- Quais parâmetros foram incluídos nos relatórios?
- Quais partes do ciclo de vida do incidente foram analisadas?
- Há algum espaço para melhorias? Em caso afirmativo, como isso pode ser feito?

### Avaliação externa - pesquisas com usuários finais

Além dos fatores acima, alguns fatores voltados para o usuário final também devem ser avaliados. Para esse fim, é realizada uma pesquisa pós-encerramento para coletar feedback dos usuários finais afetados pelo incidente. Essa pesquisa deve ser usada para obter informações sobre algumas áreas importantes, como:

- Quão fácil ou difícil foi para o usuário final relatar um incidente?
- A primeira resposta da equipe de TI foi rápida e imediata?
- O incidente foi resolvido em tempo hábil?
- Qual é o grau de satisfação do usuário final com a resolução?

## As funções e responsabilidades envolvidas no gerenciamento de incidentes de TI

![Incident management roles and responsibilities](https://www.manageengine.com/products/service-desk/it-incident-management/images/incident-management-roles.png)

Embora cada organização possa ter suas próprias funções e responsabilidades personalizadas, abaixo estão algumas das funções mais comuns do gerenciamento de incidentes de TI.

### Usuário final / usuário / solicitante

Essa é a parte interessada que geralmente sofre uma interrupção no serviço e abre um ticket de incidente para iniciar o processo de gerenciamento de incidentes.

### Central de serviços de nível 1

Esse é o primeiro ponto de contato para os solicitantes quando eles querem abrir uma solicitação ou um ticket de incidente. A central de serviços de nível 1 geralmente é composta por técnicos que têm conhecimento prático dos problemas mais comuns que podem ocorrer em um ambiente de TI, inclusive redefinições de senha e problemas de Wi-Fi.

### Central de serviços de nível 2

Essa central de serviços é composta por técnicos com conhecimento avançado de gerenciamento de incidentes. Normalmente, recebe solicitações mais complexas dos usuários finais; também recebe solicitações na forma de escalonamentos da Camada 1.

### Central de serviços de nível 3 (e superior)

Esse nível geralmente é composto por técnicos especializados que têm conhecimento avançado de domínios específicos da infraestrutura de TI. Por exemplo, os técnicos de manutenção de hardware e suporte a servidores são especializados em campos muito específicos.

### Gerente de incidentes

Essa parte interessada desempenha um papel fundamental no processo de gerenciamento de incidentes, monitorando a eficácia do processo, recomendando melhorias e garantindo que o processo seja seguido, entre outras responsabilidades.

### Proprietário do processo

Esse stakeholder é o proprietário do processo seguido para gerenciar incidentes. Ele também analisa, modifica e aprimora o processo para garantir que ele atenda melhor aos interesses da organização.

Cada função tem responsabilidades exclusivas, conforme mostrado abaixo.

### Usuário final / usuário / solicitante:

- Entra em contato com a central de serviços para fazer uma nova solicitação de incidente.
- Acompanha uma solicitação existente.
- Comunica claramente todas as informações necessárias aos técnicos.
- Reconhece a restauração do serviço e a conclusão do ticket.
- Responde a pesquisas de acompanhamento após a resolução do ticket, completando o ciclo de feedback.

### Help desk de nível 1:

- Registra todas as solicitações de incidentes recebidas com parâmetros apropriados, como categoria, urgência e prioridade.
- Atribui tickets aos técnicos.
- Analisa e resolve um incidente para restaurar o serviço.
- Encaminha os incidentes não resolvidos para a central de serviços de Nível 2.
- Reúne todas as informações necessárias dos solicitantes e envia-lhes atualizações regulares sobre o status da solicitação.
- Atua como um ponto de contato para os solicitantes e, se necessário, coordena entre a central de suporte de Nível 2 e os solicitantes.
- Verifica a resolução com o usuário final e coleta feedback.

### Central de serviços de níveis 2 e 3:

- Realiza o diagnóstico do incidente.
- Documenta as etapas seguidas para resolver o incidente e envia artigos da base de conhecimento.
- Identifica quando um incidente é um problema e converte o ticket de incidente em um de problema.
- Se o incidente for resolvido, confirma a resolução com o usuário final.
- Se o incidente não for resolvido, encaminha-o para a central de serviços de Nível 3.
- Se não for resolvido, encaminha o incidente para a equipe de gerenciamento de problemas de TI para identificar o problema subjacente ou para fornecedores externos, conforme aplicável.
- Fornece conhecimento especializado no assunto.

### Gerente de incidentes:

- Serve como ponto de contato para todos os incidentes importantes.
- Planeja e facilita todas as atividades envolvidas no processo de gerenciamento de incidentes.
- Garante que o processo correto seja seguido para todos os tickets e corrige quaisquer desvios.
- Coordena e comunica-se com o proprietário do processo.
- Garante que os SLAs sejam cumpridos.
- Identifica os incidentes que precisam ser revisados e realiza a revisão.

### Proprietário do processo:

- Assume a responsabilidade pelo processo geral de gerenciamento de incidentes.
- Define indicadores-chave de desempenho (KPIs) e alinha-os aos fatores críticos de sucesso (CSFs).
- Revisa os KPIs e garante que eles atendam às metas comerciais e aos CSFs.
- Projeta, documenta, revisa e aprimora processos.
- Estabelece a melhoria contínua dos serviços (CSI), em que os procedimentos, as políticas, as funções, a tecnologia e outros aspectos do processo de gerenciamento de incidentes sejam revisados e aprimorados.
- Mantém-se informado sobre as práticas recomendadas do setor e incorpora-as ao processo de gerenciamento de incidentes.

## Práticas recomendadas para o gerenciamento bem-sucedido de incidentes de TI

![IT incident management best practices](https://www.manageengine.com/products/service-desk/it-incident-management/images/incident-management-best-practices.png)

- Ofereça vários modos de criação de tickets, inclusive por e-mail, chamada telefônica ou portal de autoatendimento.
- Publique formulários personalizados de incidentes de TI voltados para a empresa para uma coleta eficaz de informações.
- Categorize e priorize automaticamente os incidentes de TI com base nos critérios do ticket.
- Associe SLAs a incidentes de TI com base nos parâmetros do ticket, como prioridade.
- Se todos os técnicos tiverem os mesmos níveis de habilidade, atribua tickets automaticamente aos técnicos com base em algoritmos como [balanceamento de carga e round robin](https://www.manageengine.com/products/service-desk/automation/assign-tickets-load-balancing.html).
- Associe dados de ativos de TI, problemas de TI e mudanças de TI a tickets de incidentes de TI.
- Garanta que os incidentes sejam encerrados somente depois de fornecer uma resolução adequada, confirmando com o usuário final e aplicando os códigos de encerramento apropriados.
- Configure um processo personalizado de comunicação com o usuário final para cada etapa do ciclo de vida de um incidente de TI.
- Crie e mantenha uma base de conhecimento com as soluções adequadas
- Forneça acesso baseado em funções aos usuários finais e técnicos com base na complexidade das soluções.
- Lide com incidentes importantes [criando fluxos de trabalho exclusivos](https://www.manageengine.com/br/service-desk/it-incident-management/major-incident-management.html).