Monitorear el rendimiento de los dispositivos de la red es clave para comprender las necesidades de la misma y mantener el rendimiento en niveles óptimos con los recursos adecuados. Al establecer umbrales para las métricas críticas de rendimiento, los administradores pueden supervisar de cerca las estadísticas de varios dispositivos y la red en su conjunto. Esto les ayuda a determinar cómo asignar los recursos de red para garantizar el máximo rendimiento.
Sin embargo, esto también tiene su lado negativo. Por mucho que establecer manualmente umbrales ofrezca al administrador un control total sobre las métricas de rendimiento de cada dispositivo, configurarlos puede ser un verdadero reto. Dado que el administrador debe conocer las tendencias de rendimiento de cada dispositivo, así como las estadísticas actuales, resulta extremadamente difícil configurar manualmente los umbrales de los dispositivos individuales. Y si se trata de una red empresarial con miles de dispositivos, la situación resultará más complicada.
¿Por qué es contraproducente configurar los umbrales manualmente?
La técnica de umbrales adaptativos de OpManager aprovecha el poder de machine learning para facilitar que los administradores de red realicen esta tarea crítica. Mediante avanzados algoritmos de predicción y cálculos basados en porcentajes, el umbral adaptativo de OpManager se adapta rápidamente a los constantes cambios de las métricas de rendimiento de los dispositivos de red y pronostica valores altamente fiables para sus métricas. Estos últimos se utilizan para establecer umbrales para los monitores de rendimiento configurados.
Durante la configuración de los umbrales en OpManager, los administradores de red suelen determinar el valor nominal para el monitor concreto de un dispositivo basándose en tendencias y patrones de uso anteriores. A continuación, se configuran los umbrales con ese valor de referencia para tres niveles diferentes de alertas de monitoreo de red: Atención, Crítico y Problema. Esto se hace a nivel de dispositivo, aunque también se puede aplicar a varios equipos de forma masiva.
Con el método de umbrales adaptativos, la necesidad de estudiar las estadísticas de rendimiento anteriores se elimina completamente de la ecuación. Los avanzados algoritmos de predicción de OpManager se encargan de esta tediosa tarea leyendo patrones en las estadísticas de rendimiento a lo largo de varios intervalos de tiempo y basándose en múltiples patrones de uso de la red. Por medio de estos datos, calculan un valor "previsto" altamente utilizable para ese monitor. Estos umbrales dinámicos basados en machine learning requieren al menos 14 días de datos de rendimiento para empezar a proporcionar valores de previsión. Una vez establecidos los modelos de datos y proporcionados los valores de previsión, OpManager los utiliza como valores de umbral base para controlar la frecuencia y los criterios de las alertas que se generan.
Una vez activados los umbrales adaptativos, el usuario sólo tiene que proporcionar los valores de desviación para cada criticidad de alerta. Cuando el valor del monitor concreto supera el valor de desviación configurado para una criticidad determinada, se genera una alerta con el nivel correspondiente para ese monitor.
Por ejemplo, consideremos que el valor previsto para el monitor de utilización de CPU es 70. Los valores de desviación para los niveles Atención/Problema/Crítico están configurados en 10, 15 y 20, respectivamente. A continuación, se encuentran los valores en los que se generan las alertas en este caso:
Si el mismo monitor se encuentra en 70 —y se ha configurado con porcentajes de desviación para Atención/Problema/Crítico como 10%, 15% y 20%, respectivamente—, los niveles a los que se generan las alertas son:
Nota: para obtener más información sobre cómo se calculan estos valores, tanto en términos de valores como de porcentajes, consulte esta página.
¿Cómo facilitarán el trabajo los umbrales adaptativos?
Los umbrales adaptativos de OpManager eliminan la carga de trabajo redundante de los hombros del administrador de red por las siguientes razones: