Nesta seção, focaremos nas diferenças entre gerenciamento de incidentes e gerenciamento de problemas e como o gerenciamento de problemas funciona junto com outras práticas de suporte de ITSM.

Incident management vs. problem management

Incident management and problem management

The terms incident and problem might appear to be synonymous, but both are distinct in the role they play in achieving ideal service quality. It's important to know where incident management and problem management interact with each other and how they differ, especially where an incident ends and a problem begins.

Gerenciamento de incidentes

Um incidente é uma interrupção não planejada de um serviço inteiro ou apenas de um componente. Vejamos um cenário para entendê-lo melhor. Há uma reunião importante em 15 minutos e um relatório precisa ser impresso. Infelizmente, a impressora do departamento não está funcionando. Um ticket é gerado rapidamente para corrigir uma solução alternativa e imprimir os relatórios. Isto é um incidente.

O processo de gerenciamento de incidentes trata de lidar com incidentes e restaurar o serviço o mais rápido possível. Em nosso cenário, a equipe do service desk conecta rapidamente o laptop à impressora do departamento adjacente para ajudar o usuário a preparar os relatórios a tempo para a reunião. Portanto, o objetivo do gerenciamento de incidentes é garantir que uma interrupção ou incidente seja resolvido o mais rápido possível com uma solução alternativa ou resolução.

Gerenciamento de problemas

O gerenciamento de problemas não envolve restaurar serviços ou solucionar problemas, mas determinar e remover a causa. Um problema é registrado em uma central de serviços quando há incidentes recorrentes que apresentam problemas comuns ou se ocorre um incidente grave que afeta muitos usuários. Em nosso cenário, a única impressora do departamento quebrou e todos os usuários daquele departamento foram afetados, o que foi registrado como um problema pela equipe do service desk para encontrar a causa e a solução. Um incidente pode ser encerrado quando uma solução alternativa é fornecida, mas um problema é levantado para corrigir a impressora permanentemente, para que esse problema não ocorra novamente.

Voltando ao nosso cenário, o problema da impressora passará por RCA para encontrar uma solução permanente e será rastreado como um ticket de problema enquanto o negócio continua com a solução alternativa em vigor. Se a equipe de gerenciamento de problemas não conseguir encontrar uma solução, a solução alternativa será documentada e o problema será adicionado ao KEDB. Desta forma, a gestão de problemas não consiste apenas em eliminar incidentes, encontrando a causa raiz subjacente, mas também em determinar a solução mais viável que pode ser implementada para minimizar as interrupções. Às vezes, apesar de conhecer a causa raiz, a solução mais viável é implementar uma solução alternativa e documentá-la como um erro conhecido.

Apesar de diferentes, o gerenciamento de incidentes e o gerenciamento de problemas se complementam e estão intimamente alinhados. O gerenciamento de incidentes garante a continuidade das operações de negócios, enquanto o gerenciamento de problemas cuida das questões e problemas subjacentes.

A relação entre os processos de ITSM e o gerenciamento de problemas

Um sistema integrado de melhores práticas de prestação de serviços melhora os serviços de negócios e os recursos de serviços de TI. Um processo eficaz de gerenciamento de problemas tem interações com vários outros processos de ITSM.

Problem vs Incident vs Change vs Asset management

Os processos que interagem com o gerenciamento de problemas são brevemente discutidos abaixo:

Gerenciamento de incidentes

Ogerenciamento de incidentes é o processo metódico de registrar, categorizar, priorizar, atribuir e resolver problemas em uma organização. O objetivo do gerenciamento de incidentes é reiniciar os serviços interrompidos o mais rápido possível; muitas vezes, isso significa que uma solução alternativa é organizada no lugar de uma solução permanente. Cada atividade nesta prática é documentada em escala granular e enviada à equipe de gerenciamento de problemas, que inicia a RCA para desenvolver uma solução permanente. Você pode ver que, apesar de o gerenciamento de problemas ser um processo próprio, ele depende de um processo robusto de gerenciamento de incidentes.

Gerenciamento de mudanças

O objetivo da gestão de mudanças é aumentar a taxa de sucesso de quaisquer mudanças implementadas na organização. Uma mudança refere-se a qualquer modificação feita na infraestrutura de TI, processos, serviços, produtos, aplicações, fornecedores ou qualquer outra coisa que afete implícita ou explicitamente a prestação de serviços da organização.

De acordo com a estrutura de ITSM, a responsabilidade do gerenciamento de problemas termina com a descoberta da causa raiz que leva a uma solução para um problema, e a implementação efetiva da solução é realizada com controle de alterações. Como a implementação de uma mudança envolve o gerenciamento de riscos em diversas unidades de negócios, ela exige um processo próprio para um tratamento eficiente. No entanto, a equipa de gestão de problemas deve participar na revisão pós-implementação de uma mudança para garantir a consistência entre a solução do problema e a mudança implementada associada a ela.

Gerenciamento de ativos de TI

Ogerenciamento de ativos de TIé a prática de governar o ciclo de vida de um ativo em uma organização. Suas atividades incluem obter o valor máximo dos ativos, controlar os custos dos ativos e gerenciar os riscos dos ativos. Esses riscos podem ser em termos de conformidade, seleção de fornecedores, políticas de uso e práticas de descarte.

As práticas de gestão de ativos e gestão de problemas podem se cruzar quando surgem problemas de ativos de hardware e software utilizados pela organização. Quando a causa raiz de um problema parece ser um produto ou serviço, o registro detalhado do inventário pelo gerenciamento de ativos de TI agiliza o processo de solução de problemas. Além disso, a gestão de ativos de TI auxilia a gestão de problemas no estudo do impacto de um incidente, examinando os efeitos da implementação de uma solução e fornecendo informações sempre que necessário via RCA.

IT problem resolution

Vamos colocar as coisas em perspectiva com um cenário.

Zylker é um fornecedor de banco de imagens em rápido crescimento na Índia. Um gerente em Mumbai tem enfrentado problemas para gerar relatórios mensais a partir do servidor SQL em Nova Delhi. Um incidente foi levantado e a equipe de service desk notificou os técnicos em Nova Delhi. Como solução temporária, os relatórios são gerados localmente e enviados para garantir a continuidade dos negócios.

A equipe proativa de gerenciamento de problemas da Zylker decide realizar análises de tendências em incidentes ocorridos nos últimos seis meses. Eles encontram vários incidentes relacionados ao servidor em Nova Delhi. Isto leva-os a iniciar um ticket de problema e a prosseguir com a análise investigativa utilizando os dados acumulados de todos os incidentes documentados.

O técnico em Nova Delhi percebe que o servidor SQL está usando vários tipos de protocolos, incluindo iSCSI e Fibre Channel, para vincular instalações de armazenamento de dados. Como ambos os protocolos funcionam em uma rede Ethernet, há dúvidas se o switch de bloco local foi configurado para transferência de grandes pacotes de dados. O técnico recebe dados da equipe de gerenciamento de ativos de TI e verifica se a mudança não foi a culpada. Isto é apoiado pela evidência de que a geração de relatórios localmente não era um problema.

A rede de longa distância (WAN) é a próxima na fila para análise, já que um gerente de Mumbai está tendo problemas para gerar o relatório mensal. O técnico, por sua experiência em questões de rede, tem dúvidas sobre o fluxo de tráfego no final de cada mês, por isso instala softwares nos roteadores e switches da empresa para analisar o tráfego que passa por eles e agregar estatisticamente as informações.

O software gera gráficos e tabelas que indicam os principais protocolos utilizados, juntamente com a largura de banda que cada protocolo consumiu ao longo de um mês. Isso revela um uso significativo de largura de banda no final do mês, na mesma época em que o relatório mensal é gerado. Após um exame cuidadoso, foi revelado que os backups completos das imagens foram agendados na mesma época do relatório mensal, e isso causou um gargalo significativo na WAN.

Agora que a causa raiz do problema foi identificada, o técnico gera um ticket de alteração para reprogramar o backup da imagem para as primeiras horas da manhã, antes do início dos negócios, nivelando o tráfego na rede.

Esta é uma visão geral das etapas executadas neste cenário:

AtividadePrática envolvida
O gerente em Mumbai teve problemas para gerar relatórios mensais a partir do servidor SQL em Nova Delhi. Um incidente foi levantado e os relatórios foram gerados localmente e enviados ao gestor. O ticket foi fechado.Gerenciamento de incidentes
A equipe proativa de gerenciamento de problemas executou análises de tendências em incidentes nos últimos seis meses. Eles encontraram vários incidentes envolvendo o servidor em Nova Delhi.Gerenciamento de problemas, gerenciamento de incidentes
O técnico em Nova Delhi observou a rede e o protocolo do servidor SQL e não tinha certeza se o switch de bloco local estava configurado para transferência de grandes pacotes de dados.Gerenciamento de problemas, gerenciamento de ativos de TI
O técnico recebeu dados da equipe de gerenciamento de ativos de TI e verificou que a mudança não era a culpada.Gerenciamento de problemas, gerenciamento de ativos de TI
O técnico suspeitava do fluxo de tráfego no final de cada mês e instalava softwares nos roteadores e switches que analisavam o tráfego e agregavam estatisticamente as informações.Gerenciamento de problemas, gerenciamento de ativos de TI
Após um exame cuidadoso, foi revelado que os backups completos das imagens foram agendados aproximadamente na mesma época da geração do relatório, o que causou um gargalo significativo na WAN.Gernciamento de problemas
O técnico gerou um tíquete de alteração para reprogramar o backup da imagem para as primeiras horas da manhã, antes do início dos negócios.Gerenciamento de problemas, gerenciamento de mudanças

Todas as práticas de ITSM têm um relacionamento complexo com outras práticas de TI. À medida que seu gerenciamento de problemas amadurece na prestação de serviços, certifique-se de melhorar a forma como ele interage com outras práticas para uma prestação de serviços saudável e orientada para os negócios.

A seguir:

Com uma distinção clara entre gestão de incidentes e gestão de problemas e clareza sobre a importância da gestão de problemas no que diz respeito às suas práticas de suporte de ITSM, é hora de passar para as diferentes abordagens da prática da gestão de problemas.

Avalie sua preparação para resposta a incidentes para iniciar sua jornada de gerenciamento de problemas

O passo zero na jornada rumo ao gerenciamento proativo de problemas é estabelecer um processo robusto de gerenciamento de incidentes em seu ambiente de TI. Descubra como a Zoho, nossa empresa controladora, lida com a variedade de incidentes lançados ano após ano e avalie sua prontidão para gerenciamento de incidentes em escala empresarial.

Baixe uma cópia gratuita do nosso manual de gerenciamento de incidentes e uma lista de verificação de práticas recomendadas para revisar sua solução de gerenciamento de problemas.

  • Problem management sofware feature checklist

    Lista de verificação de recursos de gerenciamento de problemas

  • major IT incident procedure

    Manual de gerenciamento de incidentes de TI

Ao clicar em 'Obter kit de recursos ITSM', você concorda com o processamento de dados pessoais de acordo com aPolítica de Privacidade.

Confiável pelas melhores organizações do mundo

Suporte mais rápido e fácil, juntos