9 razones por las cuales es importante la monitorización de redes
febrero 19, 2019Monitorización de bases de datos en la empresa actual
marzo 18, 2019No, no es normal tener 500 alarmas activas
Nuestro sistema de monitorización utilizado de manera indebida
La gente que venimos del mundo de los sistemas tenemos algunas particularidades pero en general dos muy habituales: querer instalar y configurar todo el software posible nosotros mismos pero nunca tenemos tiempo para nada. En monitorización esto se traduce en miles de instalaciones por el mundo de software como Nagios, Zabbix, Icinga, PRTG, OP5, etc. infrautilizadas, mal configuradas y, tristemente y en muchos casos sin cumplir su cometido, que es detectar los problemas antes de que afecten a los usuarios o causen daños más grandes.
¿Por qué ocurre esto? En muchos casos la secuencia es la siguiente:
- Me encantaría montar Zabbix, pero no tengo tiempo (en este paso podemos estar atascados muchas semanas).
- Un buen día se caen los sistemas y mi jefe me dice que “¿Cómo nos nos dimos cuenta? ¿No tenemos una plataforma de monitorización?”
- Saco algo de tiempo e instalo por fin, Zabbix. Siguiendo un par de tutoriales consigo configurar con las plantillas por defecto mis servidores y con algo de suerte incluso algún switch.
- Pongo en la segunda pantalla del ordenador aquellas gráficas que me parecen más interesantes. Me voy a casa y me abro una cerveza.
- ¡Una notificación de alarma! Parece que algún servidor tiene algún pico de CPU, lo revisaré mañana. Mientras me veo un capítulo de “The IT Crowd”, recibo unas 20 alarmas similares. Debe ser algo normal.
- Por la mañana al llegar a la oficina, mi correo está lleno de notificaciones de alarmas de muchos de los servidores.
- Tras pasar un rato investigando, deduzco que es por la carga que suponen los backups nocturnos y por los reinicios automatizados de ciertos procesos. Creo que debo investigar si hay manera de parar estas alarmas, ¡ah!, pero vuelvo a no tener tiempo.
- Un buen día se caen los sistemas y mi jefe me dice que “¿Cómo nos nos dimos cuenta? ¿No tenemos una plataforma de monitorización?”
- Y yo le digo, “sí, mira, revisando la carpeta dónde tengo filtrados todas las notificaciones, aquí está, el sistema nos avisó”.
- Mi jefe, “¿no debería haberse puesto algo en rojo?” Miró a mi segunda pantalla y estaba ya completamente llena de alarmas, “¿eso es normal?”.
- “Sí, eso es normal”
No, no es normal
No, no es normal. Una alarma es algo que debe “despertar” a alguien, debe representar un problema. Se pueden establecer varios niveles, que distingan a quién se debe levantar y si es algo de atención inmediata o algo que se debe registrar para revisar de forma periódica. La solución, desde luego, no es silenciar todas las alarmas: pasa por personalizar las plantillas a nuestra realidad, siempre con el foco puesto en la afectación de servicio y por tener un control de higiene sobre las alarmas, repasando periódicamente cuales están siendo útiles y cuales representan habitualmente falsas alarmas o tienen “flapping” para refinarlas.
Pero en ningún caso debe ser normal que nuestro sistema nos indique que tenemos alarmas y se ignoren porque normalmente no quieren decir nada. Para corregir esto es importante el dejarse aconsejar por expertos, con una metodología de monitorización adecuada pero adaptada a las necesidades particulares de cada uno y apoyándose en las herramientas adecuadas para conseguir sacarles el máximo partido y que la monitorización sea un fiel aliado en la operación de sistemas y aplicaciones. Monitorizar no es solo configurar las herramientas y si no saber escalar con ellas y adaptar su uso a la realidad tecnológica de cada empresa.
CEO & MANAGING DIRECTOR
Experto en monitorización IT, sistemas y redes.
Minerva es nuestra plataforma enterprise-grade de monitorización basada en Zabbix y Grafana.
¡Te ayudamos a monitorizar tus equipos de red, comunicaciones y sistemas!
Suscríbete a nuestra Newsletter