Copias de seguridad (backups) y SAIs (UPS), los grandes olvidados
Creo que todo aquel que haya trabajado con una infraestructura IT durante algún tiempo se ha encontrado alguna vez con alguno de estos problemas:
- Las copias de seguridad (backups) habían dejado de hacerse hacía meses y nadie se había dado cuenta (por un cambio de contraseña, un cambio de ubicación, llenado del disco destino, fallo en los discos del NAS, etc.)
- Los SAI (sistemas de alimentación ininterrumpida o UPS en inglés) no duran ni un suspiro cuando se va la luz: tras años sin cortes eléctricos las baterías ya no funcionan o se ha ido cargando el sistema sin control hasta que ante un corte de suministro estas se consumen enseguida.
- Las máquinas y equipos que tenemos en alta disponibilidad y que deben actuar cuando fallan sus “maestros” están apagados, desactualizados, tienen el disco duro lleno, etc.
Por suerte, y como casi siempre, llega el sistema de monitorización al rescate. Nosotros usamos nuestra plataforma, basada en
Zabbix 5.0 y
Grafana 7, pero lo que aquí contamos sirve también para otras plataformas, aunque igual es más complejo o no queda tan visual.
Monitorización de copias de seguridad / backups
Hay muchas aproximaciones a la gestión de
copias de seguridad o backups. Desde el típico script que corre en cron todas las noches hasta plataformas como
Veeam Backup. Para el primer caso y con la mayoría de plataformas, lo habitual es terminar el script o configurar la herramienta para que envíe un email con el resultado. Esto, si tienes pocos servidores o equipos, está bien, típico correo para revisar con la taza de café en la mano. Pero en cuanto tienes cierto volumen o prefieres ahorrarte 5 minutos todos los días, lo mejor es tener una herramienta que te envie un email SOLO si ha fallado. Además, ¿qué ocurre cuando no te llega ese email?
¿Ha fallado el correo o es que no se han hecho los backups? ¿Quién revisa esos correos cuando tú no estás?
El enfoque a aplicar es el mismo que para cualquier monitorización, solo avisar si hay problemas. Podemos poner nuestra herramienta de monitorización a leer emails o si el script es nuestro, simplemente enviar un Zabbix trapper o vía API un 1 o un 0 a nuestra plataforma de monitorización. Desde ella podremos indicar cuanto esperar antes de dar una alarma si no nos llega ni un 1 ni un 0 en cierto tiempo, etc. Flexibilidad total.
Veeam Backup funciona por email normalmente, pero la verdad, leer emails con cualquier plataforma, aunque factible, suele dar problemas. Por fortuna esta plataforma funciona también con traps de SNMP, avisándonos del resultado de cualquier trabajo. Lo configuramos de forma inmediata para que envíe las traps a nuestro Zabbix (más información en:
https://helpcenter.veeam.com/docs/one/alarms/snmp_traps.html?ver=100)