Nagios y Ganglia, la pareja de moda

nagios_gangliaA medida que los centros de datos crecen y el personal administrativo se reduce, la necesidad de herramientas de monitorización eficiente de los recursos es más importante que nunca. El término monitorización cuando se aplica a centros de datos puede ser confuso ya que significa diferentes cosas dependiendo de quién lo está diciendo y quién está escuchando. Por ejemplo:

  • La persona que ejecuta las aplicaciones en el clúster piensa: "¿cuándo se ejecutará mi trabajo? ¿cuándo acabará? y ¿cómo se comporta con respecto a la última vez que lo ejecuté???"
  • El operador en el centro de operaciones de red piensa: "¿cuándo vamos a ver una luz roja que significa que algo necesita ser arreglado y hacer una llamada al servicio técnico?"
  • La persona en el grupo de ingeniería de sistemas piensa: "¿cómo se están comportando nuestras máquinas? ¿todos los servicios funcionan correctamente? ¿qué tendencias vemos? y ¿cómo podemos utilizar mejor nuestros recursos informáticos???"

De uno u otro modo, estamos obligados a rebuscar en terabytes de código para controlar exactamente lo que deseamos supervisar. Y no sólo eso, también hay cientos de productos y servicios. Afortunadamente, muchas de las herramientas de supervisión son de código abierto, de hecho, muchas de ellas hacen un mejor trabajo que algunas de las aplicaciones comerciales que tratan de lograr el mismo objetivo.

La parte más difícil de usar  herramientas de monitorización de código abierto, está en llevar a cabo una instalación y configuración que funcione para nuestro entorno. Los dos principales problemas con los que nos encontramos son:

  • No hay una herramienta que supervise todo lo que queremos y de la manera que lo deseamos. ¿Por qué? Debido a que cada usuario definirá monitorización de diferentes maneras.
  • Debido al primer problema, podríamos necesitar una gran cantidad de trabajo de personalización de la herramienta para obtener exactamente lo que deseamos. ¿Por qué? Debido a que cada entorno, no importa lo standard que creamos que es, es único.

Por cierto, estos mismos dos problemas se dan en las herramientas comerciales de monitorización también.

Y aquí es dónde entra nuestra bonita pareja, Ganglia y Nagios, dos herramientas que supervisan los centros de datos. Ambos están muy utilizados en la computación de alto rendimiento (HPC), pero tienen cualidades que los hacen atractivos en otros entornos. Además, ambos han tomado diferentes posiciones en la definición de la vigilancia: Ganglia está más preocupado por la recopilación de métricas y el seguimiento en el tiempo, mientras que Nagios se ha centrado en ser un mecanismo de alerta.

Como ambos proyectos han evolucionado por separado, al final se ha producido un cierto solapamiento en algunas de las funcionalidades. Por ejemplo:

  • Ganglia solía requerir un agente para ejecutarse en cada host y obtener información de él, pero ahora las métricas se pueden obtener de cualquier cosa a través del mecanismo de suplantación de Ganglia (spoofing mechanism).
  • Nagios también se utilizaba para extraer información de sus hosts de destino, pero ahora tiene plug-ins que ejecutan agentes en los hosts de destino.

Mientras que las herramientas han convergido en algunas áreas funcionales, todavía hay bastante diferencia entre ellos por lo que ganaremos si usamos ambos en pareja. La ejecución conjunta llena los vacíos de cada producto:

  • Ganglia no tiene un sistema de notificación incorporada mientras que Nagios sobresale en esto.
  • Nagios no parecen tener agentes integrados en hosts de destino que sean escalables (aunque algunos podamos discutir este punto), mientras que esto era parte del diseño original de Ganglia.

También hay otros proyectos de código abierto que hacen cosas que nuestra pareja hace e incluso algunos son mejores en ciertas áreas. Las soluciones de monitorización de código abierto más populares son Cacti, Zenoss, Zabbix, Performance Copilot (PCP) y Clumon (además estoy seguro de que tienes uno que no está en esta lista). Muchos de ellos (incluidos Ganglia y algunos plugins de Nagios) hacen uso de RRDtool o el MRTG de Tobi Oetiker (Multi Router Traffic Grapher) para generar bonitos gráficos y almacenar datos.

Con tantas soluciones de código abierto para la monitorización de un centro de datos, a menudo sorprende ver cómo muchos se meten a desarrollar sus propias soluciones e ignoran el trabajo que ya han hecho otros. Si tienes esta necesidad, y no sabes qué elegir, nuestra pareja ganadora, Ganglia más Nagios, puede ser tu solución.

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Q
Responsive Menu Clicked Image