Sacándole todo el potencial a la monitorización de tu consumo eléctrico
julio 30, 2019Comparativa entre MQTT y OPC-UA
agosto 20, 2019Los dashboards son para el verano
En verano es muy habitual que haya menos disponibilidad del personal técnico de la empresa por vacaciones, horario de verano, etc. pero nuestro negocio no para por ello.
Que el personal técnico no esté o sea difícil de contactar puede ser un problema si nadie en la empresa es capaz de interpretar un cuadro de mando como el de la foto: ¿va todo bien? ¿deberíamos preocuparnos por esos picos en la gráfica del medio? Tanto para el directivo o responsable, como para el propio técnico es preferible evitar estas dudas… que suelen terminar con una llamada de la oficina a la playa. Si pensabas que este artículo iba de como diseñar dashboards optimizados para evitar el reflejo del sol, quedará para otra ocasión.
Que el personal técnico no esté o sea difícil de contactar puede ser un problema si nadie en la empresa es capaz de interpretar un cuadro de mando como el de la foto: ¿va todo bien? ¿deberíamos preocuparnos por esos picos en la gráfica del medio? Tanto para el directivo o responsable, como para el propio técnico es preferible evitar estas dudas… que suelen terminar con una llamada de la oficina a la playa. Si pensabas que este artículo iba de como diseñar dashboards optimizados para evitar el reflejo del sol, quedará para otra ocasión.
Tener dashboards técnicos no tiene nada de malo porque son herramientas útiles para localizar problemas en nuestros sistemas y procesos de negocio. Lo malo es que únicamente tengamos dashboards técnicos, normalmente referidos a nuestra cada vez más compleja infraestructura: kubernetes, cloud legacy, serverless, multicloud…
La monitorización bien hecha debe realizarse en sentido contrario al que se hace habitualmente. Debemos empezar desde “arriba”, más cerca del negocio que de la velocidad de giro de los discos duros.
La monitorización efectiva y que aporte valor desde la primera métrica se basa en los siguientes principios:
La monitorización bien hecha debe realizarse en sentido contrario al que se hace habitualmente. Debemos empezar desde “arriba”, más cerca del negocio que de la velocidad de giro de los discos duros.
La monitorización efectiva y que aporte valor desde la primera métrica se basa en los siguientes principios:
- Definir las métricas críticas de negocio que necesitan ser medidas, cuál es su priorización y qué se espera de ellos: números de usuarios, número de registros, registros fallidos, número de carritos abandonados, ventas, etc. El hecho de que los directivos no entiendan de tecnicismos o los técnicos de las métricas de negocio no es un obstáculo sino que a veces las cosas quedan mucho más claras. En este punto además suelen surgir muchas métricas correlacionadas como “coste de infraestructura cloud” + “número de instancias de autoescalado”: perspectivas muy distintas pero que interrelacionadas aportan más información, ponen en contexto muchos indicadores y los pone en perspectiva orientándolos a la eficiencia y el éxito.
- Establecer las métricas sobre lo que significa que el servicio esté disponible: que nuestra web cargue en X milisegundos, que nuestras APIs estén accesibles, que nuestros usuarios puedan hacer login, etc. pero aprovechando lo realizado en la clave anterior, que no haya logins o aumento en el número de registros fallidos puede ser un síntoma de que algo está yendo mal.
- Desde aquí, en fases siguientes, iremos bajando de lo general a lo específico, con nuevos dashboards que nos ayudarán a localizar la causa última del problema para solucionarla. Esto es fundamental para evitar estar constantemente atendiendo alertas que no afectan realmente al servicio, al negocio en definitiva.
Siempre hay la tentación de hacerlo al revés: recoger primero todas las métricas que se nos ocurren aunque no tengamos muy claro qué significan o cómo impactan en el servicio, plantillas de alarmado por defecto, etc. y luego comenzar a podar; pero esto suele llevar a que la tarea de visualizar toda esa información sea titánica, lo que a su vez llevará a que cada vez le hagamos menos caso con lo que pierde toda su utilidad.
Una vez hemos llegado a este punto, nuestros cuadros de mando de alto nivel deberían ser muy sencillos y reflejar esos indicadores de negocio y de estado de servicio que necesitamos y que cualquier persona puede entender y detectar realmente si existe un problema técnico o el problema ha sido apagar la campaña de Adwords en agosto.
Herramientas como Minerva, basada en Zabbix y Grafana, nos ayudan a definir la disponibilidad de los servicios en función de alarmas de diferente índole.
Una vez hemos llegado a este punto, nuestros cuadros de mando de alto nivel deberían ser muy sencillos y reflejar esos indicadores de negocio y de estado de servicio que necesitamos y que cualquier persona puede entender y detectar realmente si existe un problema técnico o el problema ha sido apagar la campaña de Adwords en agosto.
Herramientas como Minerva, basada en Zabbix y Grafana, nos ayudan a definir la disponibilidad de los servicios en función de alarmas de diferente índole.
Trabajar de esta forma reporta una serie de ventajas adicionales:
- Ahorro en costes de infraestructura de monitorización y desarrollo: recoger y almacenar métricas que solo una analista de bases de datos con experiencia de 10 años es capaz de entender tiene un coste hardware muy elevado (incluido el número de pantallas a instalar en la oficina), así como de desarrollo y ajuste de las herramientas. Te garantizamos que además después de este proceso necesitarás una herramienta que monitorice la monitorización.
- Mejor entendimiento del negocio y trabajo conjunto con la parte técnica, algo beneficioso para ambas partes que ayuda además a crear un ambiente colaborativo y de confianza. Una empresa en la que solo los de sistemas tienen dashboards en tiempo real… seguramente estén trabajando en una habitación o sótano aparte. Hay que acabar con esto: si no paramos de decir que la tecnología es clave en los negocios, ¡pongámoslo en práctica!
- La forma de pensar de todo el equipo estará más orientada a servicio, a SLAs y a una priorización y alarmado adecuados. No es raro encontrar casos en los que llama un usuario “No me va la web” y el técnico responde “Yo veo todos los servidores levantados y en verde”, a lo que el usuario contesta “¿Puedes probar desde tu navegador?”, “OK, nos ponemos a revisarlo”.
Pero tranquilo, aunque actualmente tengas más métricas por minuto que páginas sirven tus Apache o Nginx, es un genial ejercicio el plantearte esto de cero: ¿Qué condiciones se tienen que cumplir para considerar que mi servicio web está levantado? Y seguro que la respuesta va mucho más allá de un ping, pero no llega hasta el número de usuarios que se conectan a tu web desde una ciudad de más de 20.000 habitantes con playa. Nos parecen unos buenos deberes para este verano 😊
CEO & MANAGING DIRECTOR
Experto en monitorización IT, sistemas y redes.
Minerva es nuestra plataforma enterprise-grade de monitorización basada en Zabbix y Grafana.
¡Te ayudamos a monitorizar tus equipos de red, comunicaciones y sistemas!
Suscríbete a nuestra Newsletter