Monitorización segura con Zabbix
febrero 20, 2017Zabbix: Integraciones y plugins con otras herramientas
abril 8, 2017Cómo evitar el "flapping" de alarmas en Zabbix 3.2
Uno de los problemas más habituales a los que nos enfrentamos al empezar a monitorizar por primera vez servicios es el conocido como "flapping" de alarmas.
Al contratar el sistema de monitorización cloud basado en Zabbix con Muutech, se incluye la instalación en el CPD de un "muubox" que es un proxy Zabbix al que se le han añadido varios sensores de temperatura y humedad. Uno de ellos mide la temperatura de entrada de aire al rack.
La ASHRAE recomienda no bajar de 18ºC para este tipo de salas (hasta el 2005 la recomendación era no bajar de 20ºC) y por ello nuestro sistema avisa a nuestro clientes cuando este hecho ocurre -más allá del riesgo de corrosión de las placas de los servidores, está el ahorro que supone el saber que podemos aumentar 1 o 2 grados el termostato de nuestro sistema de aire acondicionado.
El caso es que si simplemente establecemos en Zabbix una regla que envíe una alarma cada vez que la temperatura baja de 18ºC, puede ocurrir que en un momento dado la temperatura oscile por encima y por debajo de este umbral:
Al contratar el sistema de monitorización cloud basado en Zabbix con Muutech, se incluye la instalación en el CPD de un "muubox" que es un proxy Zabbix al que se le han añadido varios sensores de temperatura y humedad. Uno de ellos mide la temperatura de entrada de aire al rack.
La ASHRAE recomienda no bajar de 18ºC para este tipo de salas (hasta el 2005 la recomendación era no bajar de 20ºC) y por ello nuestro sistema avisa a nuestro clientes cuando este hecho ocurre -más allá del riesgo de corrosión de las placas de los servidores, está el ahorro que supone el saber que podemos aumentar 1 o 2 grados el termostato de nuestro sistema de aire acondicionado.
El caso es que si simplemente establecemos en Zabbix una regla que envíe una alarma cada vez que la temperatura baja de 18ºC, puede ocurrir que en un momento dado la temperatura oscile por encima y por debajo de este umbral:
Lo cual se traduce en nuestro correo, en esto:
El que esto ocurra dificulta en gran medida la utilidad de las alarmas por cualquier medio y al receptor pueden terminar pareciéndole todo falsas alarmas, o directamente su cliente de correo puede decidir marcarlos como spam. Nuestro trabajo en Muutech es ayudarte a ajustar estar alarmas para que te sean realmente útiles usando técnicas como la que os contamos ahora: la histéresis.
La histéresis consiste, esencialmente en establecer un umbral o condición diferente para la desaparición de la alarma. De este modo, avisamos cuando pasemos por debajo de los 18ºC pero no damos por resuelta la alarma hasta que se superen los 18.5ºC por ejemplo. Configurar y visualizar esto en Zabbix 3.2 es muy sencillo, al poder introducir directamente un criterio de recuperación, en este caso:
La histéresis consiste, esencialmente en establecer un umbral o condición diferente para la desaparición de la alarma. De este modo, avisamos cuando pasemos por debajo de los 18ºC pero no damos por resuelta la alarma hasta que se superen los 18.5ºC por ejemplo. Configurar y visualizar esto en Zabbix 3.2 es muy sencillo, al poder introducir directamente un criterio de recuperación, en este caso:
Existen otro tipo de técnicas para aumentar la precisión de estas alarmas que se pueden usar de forma combinada con la histéresis: por ejemplo, buscar máximos y mínimos o medias en periodos de tiempo o número de muestras frente a usar el únicamente último valor. En el ejemplo usamos "max(300)" para chequear que durante 5 minutos la temperatura haya estado siempre por debajo de 18 grados.
Podéis encontrar algunas de estas técnicas, así como configurar esto si tu versión de Zabbix es inferior a la 3.2 aquí.
Para cualquier duda o ayuda que os podamos prestar no dejéis de contactarnos: info@muutech.com
Podéis encontrar algunas de estas técnicas, así como configurar esto si tu versión de Zabbix es inferior a la 3.2 aquí.
Para cualquier duda o ayuda que os podamos prestar no dejéis de contactarnos: info@muutech.com
CEO & MANAGING DIRECTOR
Experto en monitorización IT, sistemas y redes.
Minerva es nuestra plataforma enterprise-grade de monitorización basada en Zabbix y Grafana.
¡Te ayudamos a monitorizar tus equipos de red, comunicaciones y sistemas!
Suscríbete a nuestra Newsletter