Etiquetas

, , , , , , , , ,

Las redes de cómputo de las organizaciones, se vuelven cada vez más complejas y la exigencia de la operación es más demandante. Las redes, cada vez más, soportan aplicaciones y servicios estratégicos de las organizaciones. Por lo cual el análisis y monitoreo de redes se ha convertido en una labor importante, primordial y de carácter pro-activo para evitar problemas.

Para prevenir errores en un sistema existente podemos utilizar un equipo que se ocupe de estar “controlando y observando” el funcionamiento de la red, esto podemos realizarlo por medio del software Nagios.

Nagios es un sistema de monitorización de equipos y servicios de red, escrito en C y publicado bajo la GNU General Public License, el lenguage con el cual está desarrollado nos asegura una rápida ejecución y su licencia que lo determina como Software Libre nos asegura que siempre tendrémos actualizaciones disponibles y que hay una gran comunidad de desarrolladores soportándolo.

Creado para ayudar a los administradores a tener siempre el control de qué está pasando en la red que administran y conocer los problemas que ocurren en la infraestructura, que administran, antes de que los usuarios de la misma los perciban, para así no sólo poder tomar la iniciativa, sino asumir la responsabilidad de hacer que las cosas sucedan; decidir en cada momento lo que queremos hacer y cómo lo vamos a hacer, debido a que este software nos permite obtener datos, interpretarlos y tomar decisiones en base a ello, como:

  • Conservar y almacene datos de la red para manejar reportes y tendencias
  • Ver y analizar la red, así como el tráfico de la red a través del tiempo
  • Monitorear el estado de la red en comparación a los reportes de análisis
  • Generar reportes sustentados para justificar las necesidades de actualización de la red

Para facilitar tareas de explotación de datos, hay diferentes aditivos como un visor de reportes integrados, en el cual se puede ver el histórico de actividad y performance de servicios, y además un visor de diagramas de red con el estado actual de cada equipo.

El mismo, está constituido por un Núcleo que construye la interfaz de usuario y por plugins los cuales representan los ojos y oídos de Nagios y por lo cual se encargan de recopilar información (bajo demanda). Los mismos pueden estar programados en diversos lenguajes como C, C++, Python, Perl, PHP, Java, Bash etc, ya que Nagios es independiente del lenguaje en el cual que se desarrolle el plugin y solo procesa los datos recibidos de este, para la posterior elaboración y envío de notificaciones a los encargados de la administración del sistema en cuestión.

Objetivos y necesidades

Conocer el estado de diferentes servicios brindados por equipos como servidores corriendo diferentes sistemas operativos, routers de los cuales dependen varios equipos. Obtener información de los mismos como estado en red, tiempo arriba, puertos abiertos, servicios y procesos corriendo, carga de CPU, carga de memoria física, carga de memoria virtual, espacio en disco, interfaces de red activas. Es posible conocer los estados y datos de estos diferentes equipos para una posterior elaboración de reportes. Elaborando una configuración personalizada de Nagios para cada caso en particular, por medio de testeo de paquetes de red, o haciendo uso de diferentes funciones que provee el protocolo SNMP (Simple Network Management Protocol) que nos permite gestionar y/o supervisar datos de diferentes elementos y componentes de la red como routers, switches, servidores, etc. y al ser un protocolo estándar es posible monitorizar una amplia variedad de casos en escenarios con sistemas ó equipos diferentes.

Con lo cual podremos concluir si el sistema:

  • Lleva a cabo eficazmente su finalidad
  • Utiliza eficientemente los recursos

Ya que podemos:

  • Detectar de forma sistemática el uso de los recursos y los flujos de información dentro de una organización.
  • Determinar qué información es crítica para el cumplimiento de su misión y objetivos, identificando necesidades, duplicidades, costos, valor y barreras, que obstaculizan flujos de información eficientes.
  • Análizar la eficiencia del sistema.
  • Verificar el cumplimiento de Normativas.
  • Revisión de la gestión de recursos.

Information Technology Infrastructure Library – ITIL

Situándonos en el marco ITIL (Biblioteca de Infraestructura de Tecnologías de Información) para la provisión de servicios TI con calidad, los tres objetivos claves de la Gestión de Servicios son:

  • Alinear los servicios informáticos con las necesidades actuales y futuras
  • Mejorar la calidad de los servicios informáticos entregados
  • Reducir el coste a largo plazo del suministro de servicios

¿Cómo encuandra Nagios en ITIL?

En ITIL, los consultores acompañan a las empresas a diseñar y/o implementar sus procesos. También realizan GAPs para evaluar cuán cerca se encuentra la organización de las actividades que se recomiendan en las mejores prácticas y se recomiendan posibles mejoras para acercarse.

Nagios cubre estas áreas de ITIL :

  • Service Desk
  • Incident Management
  • Service Level Management
  • Capacity Management
  • IT Service Continuity Management
  • Availability Management
  • ICT Infrastructure Management

Gestión de la disponibilidad

  • La disponibilidad “Availability Management” es un proceso del “Service Delivery”, definido en las especificaciones de ITIL.
    • Su meta es asegurar que el nivel de disponibilidad requerido esté proporcionado.
    • La supervisión y análisis de informes de la disponibilidad es una actividad clave para asegurar que los niveles del servicio se estén cumpliendo.
    • En la base de la gestión se debe supervisar contínuamente la disponibilidad de la Infraestructura, servicios y alertar a los administradores para iniciar los procedimientos oportunos.

Tiempo resolución de Incidencias

  • El tiempo de identificación de un problema mejora notablemente con la utilización de Nagios
    • Su meta es asegurar que el administrador identifique el problema antes que lo hagan los usuarios.
    • La supervisión y análisis de todos los servicios críticos y la notificación correcta es clave para reducir el tiempo de resolución
    • Los informes de incidencias y performance ayudarán en la predicción de problemas y en identificar la necesidad de crecimientos.
    • Mejorando la Gestion de capacidad, estando directamente conectado con el processo de ITIL “Capacity Management”

Objetivos a largo plazo

Aplicando las normas ITIL:

  • Alinear los servicios de TI con las necesidades de la empresa (el negocio), actuales y futuras.
  • Mejorar la calidad de los servicios de TI.
  • Reducir los costos por la proveeduría de servicios de TI en el mediano y largo plazos.
  • Mejora de rendimiento de la inversión de TI.
  • Se mide el sistema de TI de la organización evaluando los procesos de Soporte Técnico y Entrega de Servicios comparándolos con las Mejores Prácticas.

Descripción

Qué puede hacer Nagios

  • Monitorización de servicios de red (SMTP, POP3, HTTP, NTTP, ICMP, SNMP).
  • Monitorización de los recursos de un host (carga del procesador, uso de los discos, logs del sistema) en varios sistemas operativos, incluso Microsoft Windows con el plugin NRPE_NT o también por medio del protocolo SNMP.
  • Monitorización remoto, a través de túneles SSL cifrados o SSH.
  • Diseño simple de plugins, que permiten a los usuarios desarrollar sus propios chequeos de servicios dependiendo de sus necesidades, usando sus herramientas preferidas (Bash, C++, Perl, Ruby, Python, PHP, C#, Java, etc.).
  • Chequeo de servicios paralizados.
  • Posibilidad de definir la jerarquía de la red, permitiendo distinguir entre host caídos y host inaccesibles.
  • Notificaciones a los contactos cuando ocurren problemas en servicios o hosts, así como cuando son resueltos ( Vía email, pager, Jabber, SMS o cualquier método definido por el usuario junto con su correspondiente complemento).
  • Posibilidad de definir manejadores de eventos que ejecuten al ocurrir un evento de un servicio o host para resoluciones de problemas proactivas.
  • Rotación automática del archivo de registro.
  • Soporte para implementar hosts de monitores redundantes.
  • Interfaz web opcional, para observar el estado de la red actual, notificaciones, historial de problemas, archivos de registros, etc.
  • Reportes y estadísticas del estado cronológico de disponibilidad de servicios y hosts.

Quién va a usar Nagios

  • Administradores de Redes con alto conocimiento tecnico
  • Operadores con mínimo conocimiento técnico de la situacion, o conocimiento puntual de algun servicio
  • Pudiedo avisar y ayudar a determinar posibles causas de efectos producidos
  • Equipos de desarrollo
  • Coordinadores de Mesas de Ayuda
  • Areas relacionadas

Beneficios

  • Mejora de productividad
  • Anticipación de problemas
  • Reporte y aviso de incidentes
    • Agilidad en su tratamiento
  • Mejor y mayor relacion e integracion de sectores adjuntos

Requerimientos

  • Plan de acción bien diagramado
  • Personal con conocimiento medio/avanzado en redes
  • Hardware acorde a la inversion y criticidad de los datos
    • Si se van a monitorear >= 600 host y >= 2000 servicios hay que plantear bien esto, no sobrevaluar pero tampoco escatimar

Agradecimiento a S. Cayuqueo