Gerenciando alertas VMware

Os recursos dinâmicos de alertas e limiares do OpManager são centrais para uma abordagem de monitoramento proativo. O OpManager obtém eventos de cada vCenter/host ESX de forma transparente, de maneira semelhante a traps SNMP. Atualmente, uma lista de eventos importantes é suportada, e essa lista é atualizada a cada release. Além desses eventos, o OpManager também monitora limiares para indicadores críticos de desempenho e gera alertas. 

Para ajustar esse sistema às suas necessidades e alterar os valores de limiar pré-definidos para cada monitor de desempenho, acesse a seção Monitores na página de snapshot do host / VM / Datastore.

Gerenciamento de alertas VMware no OpManager: lista de monitores de VM na aba Monitores do OpManager

Para visualizar a lista completa de monitores VMware,

  • Para visualizar a lista completa de monitores VMware, navegue até Settings → Performance Monitors e aplique um filtro usando o protocolo ‘VIWebService’.
  • Na aba Performance Monitors, clique em “Actions” e depois em “Add Performance Monitor”. Isso exibirá uma lista de todos os monitores de desempenho disponíveis no OpManager.
  • Para visualizar a lista de monitores de desempenho apenas para hosts VMware, navegue até a seção VMware-Host Monitors.
  • Para visualizar a lista de monitores de desempenho para VMs, navegue até a seção VMware - VM snapshot page - Monitors tab - VM Monitors.
  • Para visualizar a lista de monitores de desempenho para Datastore, navegue até a seção VMware - Datastore snapshot page - Monitors tab - Datastore Monitors.
  • Você também pode visualizar e adicionar monitores de desempenho para hosts/VMs clicando em 'Add Monitors' em seus respectivos Modelos de Dispositivo (Device Templates).

Tabela 1: Lista de alguns monitores de limiar para indicadores críticos de desempenho relacionados a host, datastore e VMs suportados pelo OpManager

Monitores de limiarTipo de dispositivo virtualRecurso
1.Host Network Received PacketsHostRede
2.Host Network Transmitted PacketsHostRede
3.Host Network Usage (avg)HostRede
4.Host CPU Utilization (avg)HostCPU
5.Host Memory Utilization (avg)HostMemória
6.Host Disk Read LatencyHostDisco
7.Host Disk Write LatencyHostDisco
8.Datastore FreespaceHostRede
9.VirtualMachine Network Packets ReceivedVMRede
10.VirtualMachine Network Packets TransmittedVMRede
11.VirtualMachine Network Usage (avg)VMRede
12.VirtualMachine CPU Utilization (avg)VMCPU
13.VirtualMachine Memory Usage (avg)VMMemória

 

Tabela 2: Alguns dos eventos de hosts VCenter / ESX suportados pelo OpManager

EventosTipo de dispositivo virtualSeveridade
1.VmFailedToPowerOffEventVMCrítico
2.VmPoweredOffEventVMAtenção
3.VmPowerOffOnIsolationEventVMNormal
4.VmFailedToPowerOnEventVMCrítico
5.VmPoweredOnEventVMAtenção
6.VmFailedToSuspendEventVMCrítico
7.VmSuspendedEventVMAtenção
8.VmFailedToRebootGuestEventVMCrítico
9.VmGuestRebootEventVMNormal
10.VmFailoverFailedVMProblema
11VmPrimaryFailoverEventVMCrítico
12.VmUpgradeFailedEventVMCrítico
13.VmUpgradeCompleteEventVMNormal
14.VmDisconnectedEventVMAtenção
15.VmConnectedEventVMAtenção
16.VmDiskFailedEventVMCrítico
17.VmRelocatedEventVMAtenção
18.VmRelocateFailedEventVMCrítico

Você pode visualizar a lista completa de eventos de host ESX/vCenter que são suportados pelo OpManager em Settings → Monitors → VMware Events.

Observação: o OpManager apenas dispara alarmes com base em eventos VMware, e eles devem ser limpos manualmente após a resolução do problema/notificação.

Além disso, você também pode habilitar alertas baseados em NIC física/Host Bus Adapter no OpManager para seus dispositivos VMware pai. Esses alertas podem ser habilitados durante a descoberta desse dispositivo pai ou na página Update Inventory, ativando a opção "Raise alerts for Physical NIC & Host Bus Adapter". Estas são as mensagens de status disponíveis no OpManager e seus equivalentes de NIC/HBA:

Mensagens de status da NIC física:

Mensagem de status do OpManagerStatus correspondente da NIC
1NormalConectado
2CríticoDesconectado

Mensagens de status do Host Bus Adapter:

Mensagem de status do OpManagerStatus correspondente do HBA
1NormalOnline
2AtençãoUnbound (ou) Offline
3ProblemaFault

Para obter insights aprofundados sobre as práticas de monitoramento VMware do OpManager, consulte os seguintes documentos de ajuda.