Estudo de caso

Um banco líder obtém um tempo médio de confirmação (MTTA) de 3 minutos com o OpManager Plus da ManageEngine

Estabelecida há mais de 25 anos em uma das movimentadas cidades metropolitanas da Índia, esta instituição financeira oferece serviços bancários essenciais e produtos de varejo, como empréstimos, cartões de crédito e débito e contas de transação para comunidades em todo o país. Com uma rede formada por mais de 5.000 agências em mais de 3.500 cidades e uma sólida presença de mais de 15.000 caixas eletrônicos/máquinas de reciclagem de dinheiro em todo o país, o banco atende clientes das áreas rurais, semiurbanas e urbanas do país. Além disso, o banco ampliou seu alcance internacional com filiais em locais importantes, como Singapura e Reino Unido.

Tipo de setor

Bancário

Filiais

Mais de 5.000

Clientes

Mais de 100 milhões

A jornada do banco digital

Reconhecendo as mudanças nas exigências da sua clientela e o interesse crescente por soluções bancárias digitais, a liderança da instituição priorizou os serviços bancários digitais juntamente com a abordagem bancária tradicional.

Adotar a transformação digital exigiu uma forte infraestrutura de TI. O banco investiu na construção de um ecossistema de rede com mais de 45.000 dispositivos e mais de 1.000 aplicações – uma combinação de aplicações voltadas para o cliente e aplicações de uso interno. Ele também investiu na construção de um server farm com sistemas operacionais IBM AIX para hospedar aplicações essenciais aos negócios, garantindo ao mesmo tempo a segurança e cumprimento dos regulamentos SEBI e RBI.

Conforme sua presença digital crescia, o banco implementou ferramentas de monitoramento dedicadas a monitorar sua rede distribuída e multifacetada. Entretanto, ferramentas de monitoramento separadas para cada função levaram à compartimentação dos dados, aumento de custos, além de oferecer insights deficientes. Isso tornou o monitoramento da infraestrutura de TI complicado.

Ficou claro que o banco precisava de uma solução que oferecesse visibilidade centralizada de todos os dados que lhe permitisse identificar falhas com facilidade, monitorar o comportamento do desempenho e receber insights oportunos e acionáveis para melhorar sua rede ao longo do caminho.

A busca por soluções de monitoramento completa s e acessíveis levou a instituição bancária a identificar o OpManager Plus da ManageEngine. Com a nossa solução, ela conseguiu monitorar sua TI de maneira completa e eliminar a necessidade de ferramentas distintas.

O recurso de alerta por SMS desempenhou um papel fundamental na mitigação significativa do tempo de resolução de falhas. Esse recurso permitiu que o banco reduzisse o tempo médio de confirmação (MTTA) de significativas quatro horas para menos de três minutos. Consequentemente, ele conseguiu evitar interrupções de aplicações e servidores, reduzindo drasticamente o valor do tempo médio de resolução (MTTR).

Os desafios

Com mais de 60 ferramentas, cada uma atendendo a um propósito específico, o banco se via afogado em um mar de desafios antes de implementar o OpManager Plus da ManageEngine.

1. Crescimento do número de ferramentas

O banco utilizava muitas ferramentas de monitoramento, como Cisco AppDynamics, CA Broadcom, Dynatrace, Oracle Enterprise Manager e NetApp Active IQ. Cada ferramenta atendia bem ao seu propósito específico, mas a falta de colaboração entre elas significava que as equipes de TI tinham que ver os dados em silos, agrupá-los manualmente e entendê-los. Com os dados espalhados por ferramentas distintas, os administradores de TI tinham que alternar entre várias abas antes de obter insights úteis.

Isso transformava até mesmo tarefas simples, como analisar uma falha, em algo complexo. Consequentemente, a produtividade global e eficiência do processo de monitoramento foram fortemente afetadas. Além disso, o uso de diversas ferramentas aumentava os custos e exigia pessoal dedicado para gerenciar as licenças.

2. O desafio do tempo na adoção de ferramentas

O tempo consumido para a adoção de ferramentas era uma grande preocupação para a equipe de liderança de TI do banco. Cada ferramenta tinha uma curva de aprendizado única e consumia um tempo significativo para treinamento dos funcionários. Consolidar as ferramentas atuais e substituir as existentes por uma solução fácil de usar era o caminho a seguir para o banco enfrentar este desafio.

3. Processo de tomada de decisão prolongado

A falta de clareza era outra grande desvantagem do uso de ferramentas de diferentes fornecedores. Durante uma análise ou solução de problemas, os membros das equipes devem obter visibilidade dos dados. Isso garante que uma descoberta leve a outra e, em última análise, possibilita que as equipes de TI infiram algo útil. No entanto, ferramentas separadas dificultavam o fluxo de comunicação entre as equipes e atrasavam o processo de tomada de decisão, aumentando o tempo necessário para identificar a causa-raiz.

As aplicações bancárias são críticas e qualquer interrupção do serviço, mesmo que por um curto período, seria algo extremamente caro. Portanto, o banco precisava de uma solução que agilizasse o processo de resolução de falhas.

A liderança da instituição financeira logo percebeu essas limitações e as solucionou migrando para a solução completa e full stack de infraestrutura de TI OpManager Plus da ManageEngine.

O desafio da visibilidade: Uma operação de migração crítica

O banco conseguiu abordar as preocupações de toda a empresa como a expansão e adoção de ferramentas investindo no OpManager Plus. Após o investimento, ele conseguiu enfrentar outro desafio crescente sob a forma de falta de visibilidade durante uma operação de migração crítica.

Quando o banco decidiu fazer a transição dos servidores legados Sun Solaris para servidores baseados em Linux, precisou enfrentar o desafio potencial de um tempo de inatividade não planejado. Garantir a continuidade dos negócios era importante, pois uma interrupção dos servidores do banco pode afetar a prestação de serviços aos clientes. O banco planejou realizar a migração sob um mecanismo de recuperação de desastres para garantir a continuidade dos negócios.

Durante o processo de migração, ele utilizou a nossa solução para monitorar sua infraestrutura de TI visando garantir que serviços críticos não fossem afetados. O painel do OpManager Plus ajudou-o a ter uma visão geral em tempo real do desempenho do dispositivo durante a migração. Considerando a arquitetura distribuída da sua rede, a equipe centralizada do NOC precisava de um painel unificado para obter uma visão holística de parâmetros importantes.

Utilizando a visão de NOC especializada, que fornece uma visualização semelhante a um CFTV de vários painéis individuais, a equipe de administração central conseguiu ver o desempenho de toda a rede.

Alertas baseados em SMS: Um recurso distintivo

O recurso de perfil de notificação permitiu que os administradores de TI recebessem alertas sempre que um dispositivo começasse a apresentar desempenho inferior. Além disso, o banco utilizou a capacidade de monitoramento de thresholds, permitindo que os administradores de TI definissem valores de threshold para métricas importantes, de maneira que sempre que um dispositivo começar a apresentar desempenho inferior, um alerta será acionado, solicitando uma ação rápida que poderá evitar um problema potencial.

Embora as ferramentas de monitoramento utilizadas anteriormente também tivessem a opção de alerta, o que diferenciava o OpManager Plus da ManageEngine era a opção de alerta por SMS. Ao contrário dos alertas por e-mail, que algumas vezes podem passar despercebidos quando os administradores de TI não estão diante das telas, um alerta por SMS nos seus celulares obtém atenção imediata. Este mecanismo simples, mas eficaz, mitigou significativamente os riscos de tempo de inatividade e ajudou a manter uma rede operacional durante toda a fase de migração.

Os itens essenciais para a solução

A liderança do banco formulou uma lista de verificação dos aspectos essenciais que buscava na solução.

  • Para implementar uma solução de monitoramento que monitore e forneça visibilidade completa de todos os aspectos da rede: desempenho de aplicações, transações e saúde da rede.
  • Para investir em uma solução acessível que ofereça capacidades avançadas de produto e uma interface de usuário fácil de usar.
  • Para combinar tantos sistemas de monitoramento diferentes em uma plataforma
  • Para usar um sistema que monitorasse a rede distribuída geograficamente

A solução

Visando selecionar uma solução que atendesse aos seus objetivos, o banco explorou diversos fornecedores no mercado. Após uma análise minuciosa, o OpManager Plus da ManageEngine surgiu como a escolha certa para atingir seus objetivos. Um fator importante que funcionou a nosso favor foi a proposta de grande valor que nossa solução oferecia a um preço acessível. Além disso, a liderança do banco ficou muito impressionada com o serviço e suporte excelentes e ágeis que oferecemos. Assim que conquistamos a confiança da instituição financeira, a transição para a fase de implementação foi tranquila.

Avaliação e implementação

Durante a fase de avaliação e implementação, nossa equipe interagiu com as principais partes interessadas do banco. As conversas iniciais envolveram discussões técnicas detalhadas sobre seus requisitos de alto nível e considerações de segurança. As discussões posteriores incluíram conversas com equipes individuais onde questões específicas foram abordadas.

Os altos executivos do banco queriam que o OpManager Plus monitorasse as principais métricas de desempenho de aplicações e fornecesse visibilidade profunda de detalhes granulares para os técnicos de TI, além de oferecer uma visão geral da rede distribuída para a equipe de liderança de TI. Nossos engenheiros técnicos qualificados entenderam suas necessidades e implementaram a solução completa, para que ela estivesse pronta para monitoramento imediatamente.

Monitoramento simplificado de desempenho de aplicações

O banco queria principalmente monitorar suas aplicações, que podem ser categorizadas em dois grupos: aplicações voltadas para o cliente que forneciam serviços como pagamentos de empréstimos e internet banking, e aplicações de uso interno, como análises, detecção de fraudes, gerenciamento de risco e monitoramento de transações.

Havia equipes de TI separadas para monitorar cada aplicação e seus servidores e bancos de dados associados. Era difícil levantar informações de monitoramento quando todos os dados estavam disponíveis sem classificação. Agora, com o recurso de grupos de monitores do OpManager Plus, as métricas das aplicações são agrupadas com base no caso de uso de negócios que resolvem. Por exemplo, a aplicação de internet banking é um grupo de monitores, sob o qual todas as métricas de desempenho e métricas de servidores associadas estarão disponíveis. Esse agrupamento oferecia melhor visibilidade para as equipes de TI sobre a aplicação monitorada.

Solução de problemas acelerada

A redução do MTTR era outro grande desafio enfrentado pelos membros da equipe de TI. Quando uma degradação de desempenho ou uma interrupção era detectada, analisar vários sistemas para identificar a causa-raiz era uma tarefa difícil e demorada. Simplificar os dados e fornecer visibilidade em um console unificado era fundamental para resolver esse problema, e o OpManager Plus fez isso. O agente de insights do APM foi implantado em cada servidor de aplicações, levantou dados de monitoramento e preencheu as informações com visibilidade completa.

Os dados coletados fornecem análises profundas de métricas importantes, como tempo de resposta da aplicação, rendimento e disponibilidade. Com cerca de 10.000 transações por segundo, o OpManager Plus permitiu que a equipe de TI do banco acompanhasse todas as transações associadas às aplicações.

A partir da lista exaustiva de transações, os administradores de TI conseguiram identificar transações lentas e oferecer detalhes granulares, como consultas SQL lentas, além de restringir a causa-raiz para ajustar o desempenho.

Monitoramento avançado de servidores IBM AIX

Por padrão, o OpManager Plus categoriza as métricas de desempenho de servidores em seis grupos: Visão geral, CPU, disco, rede, erros (Errpt) e configuração. Os membros da equipe de TI conseguiram obter insights mais detalhados em cada categoria. Por exemplo, na CPU, métricas de CPU associadas, como detalhamento da utilização da CPU (%) versus tempo, utilização da CPU por núcleos de CPU e tempo de espera de E/S (%) versus tempo são encontradas.

Com todas as métricas devidamente integradas em um console unificado, a equipe de monitoramento de servidores do banco sentiu-se tranquila. Ela conseguiu correlacionar métricas, entender o comportamento real do desempenho e melhorá-lo.

Outros recursos do OpManager Plus em ação!

  • Pontuação do APDEX: A experiência do cliente é um determinante crucial para uma melhor retenção de clientes e crescimento geral do negócio. No entanto, o banco não tinha um mecanismo adequado para entender a experiência do usuário final. É aqui que a pontuação do APDEX entra em jogo. A pontuação do APDEX oferecida no OpManager Plus permitiu que as equipes de TI entendessem o desempenho das aplicações da perspectiva de um usuário final.

    Variando de 0 a 1, a pontuação do APDEX ajudou as equipes de TI a entender claramente se os usuários finais estão satisfeitos, tolerantes ou frustrados com os serviços, otimizando o desempenho com base nisso. (Uma pontuação 1 indica que todos os usuários estão satisfeitos, enquanto 0 indica que nenhum está satisfeito).

  • Relatórios de planejamento da capacidade: O banco utilizou relatórios de planejamento de capacidade incluídos na nossa solução para otimizar a alocação de recursos e garantir que todos os serviços estivessem sempre suficientemente dimensionados. A equipe de TI obteve acesso aos relatórios que destacam servidores superutilizados ou subutilizados com base em métricas críticas, incluindo utilização da CPU, de disco e memória. Isto permitiu-lhe evitar o desperdício de recursos e adotar um processo de tomada de decisões baseado em dados.

    Além disso, o CTO e gerentes exigiam relatórios mensais para entender o desempenho da sua rede durante um determinado período para tomar decisões fundamentadas. Com a opção de programação de relatórios, as partes interessadas puderam recebê-los em intervalos regulares, que usaram para entender tendências de desempenho, identificar deficiências e realizar melhorias estratégicas.

  • Detecção de anomalias: TAs equipes de monitoramento de servidores utilizaram o recurso de detecção de anomalias para resolver problemas potenciais ou evitar interrupções proativamente. Os administradores de servidores configuraram os valores de linha de base para as métricas. Quando os valores reais começavam a se afastar dos limites da linha de base, um alerta era gerado, solicitando que os administradores implementassem ações corretivas. Isto demonstrou ser útil, pois evitou problemas de degradação de desempenho antes que eles afetassem o usuário final.

Os resultados

O OpManager Plus da ManageEngine complementou a abordagem de serviços bancários digitais do banco e permitiu-lhe melhorar a prestação de serviços significativamente. Aqui estão alguns dos benefícios que o banco obtém ao investir na nossa solução.

Complexidades de licenciamento mitigadas

Antes de migrar para a ManageEngine, a instituição utilizava mais de 65 ferramentas para gerenciar sua TI. Isso adicionava camadas de complexidade ao gerenciamento de licenças e aumentava os custos indiretos significativamente. Com o OpManager Plus, o banco conseguiu fazer mais com menos e reduzir o total de ferramentas para cerca de 13.

A natureza fácil de usar da nossa solução significava que a equipe não precisava gastar muito tempo treinando seus membros sobre como utilizá-la. Assim que começou a usar a solução, ela se tornou algo familiar.

Insights completo s e detalhados oferecidos

O OpManager Plus foi uma solução que atendeu a todas as necessidades de toda a equipe de TI, desde o Diretor de Tecnologia (CTO) de alto nível até o técnico de TI de linha de frente. Ele ofereceu uma visão rápida e de alto nível do desempenho da sua rede para altos executivos, ao mesmo tempo que disponibilizava uma análise profunda de detalhes específicos, como o desempenho de uma transação de aplicação, necessária para um administrador de TI.

Silos operacionais reduzidos

Ao passar das muitas ferramentas de propósito único para um conjunto completo de soluções de ITOM oferecido pelo OpManager Plus, o banco conseguiu reduzir muitos silos operacionais que afetavam sua rede.

Com uma plataforma unificada para gerenciar toda a sua rede de TI, ele preencheu a lacuna entre equipes diferentes, melhorando a colaboração e simplificando as medidas corretivas e fluxos de trabalho necessários para a solução de problemas.

Sobre o OpManager Plus

O OpManager Plus da ManageEngine é uma solução de observabilidade full-stack que fornece visibilidade aprimorada de aplicações, infraestrutura e redes às organizações, juntamente com visibilidade de segurança para ambientes híbridos que consistem em instâncias locais e em nuvem.

Ele permite que as organizações forneçam uma experiência superior ao usuário final e gerem resultados de negócios melhores, ajudando-as a gerenciar seus ambientes de TI, automatizar a correção de falhas e eliminar silos operacionais proativamente. Contando com a confiança de administradores de TI em todo o mundo para agilizar suas operações de TI, o OpManager Plus é a solução de observabilidade ideal para empresas de todos os portes que priorizam o digital.

Para mais informações visite o site https://www.manageengine.com/br/it-operations-management.

Comece com um teste grátis hoje mesmo.

Faça um teste grátis de 30 dias