Monitorizacion

Agenda

 Teoría
 Monitorización Hardware
 SNMP
 Cacti
 Nagios
 Otros
 Ajustes de rendimiento

Fernando Arconada Oróstegui

Visión

Hardware Servicio


¿Qué es monitorizar?

La monitorización es un proceso que Hace
referencia a la supervisión necesaria para la
ejecución del plan de acción establecido en la
planificacion


¿Qué es monitorizar?

La monitorización puede detectar las posibles
interferencias que pudieran presentarse en el
curso de alguna acción y puede dar lugar a
corregir el procedimiento antes de llegar a un
resultado final.


Pasos previos

 Análisis detallado del sistema informático a
monitorizar
 Detectar los sistemas críticos (tanto máquinas
como servicios)
 Formular políticas de actuación frente a
incidencias


3 reglas

1- Mantener las medidas de seguridad existentes.


3 reglas


3 reglas

2- Minimizar el impacto en el propio sistema a
estudiar


3 reglas

3 – El punto de vista del monitor es subjetivo,
depende de la posicion


¿Qué comprobar y cómo
hacerlo?

Comprobar el estado

 Comprobar limites
 Comprobar si se ejecuta
¿una pagina web que tarda 2 minutos en responder
podemos considerar que funciona bien?


Cómo comprobar el estado

 Script
 Ficheros de estado
 Agentes
 SNMP


Con o sin Agente

 Basado en agente
 Impacto sobre la medida
 Información mas detallada
 Suelen tener mayor impacto en el rendimiento


Con o sin Agente

 Sin agente
 No son intrusivos
 Menos detalle


Con o sin Agente

 SNMP
 Es algo intermedio, una especie de agente ligero


Alertas y notificaciones

 Envía una señal de alarma
 Email, SMS, XMPP, otros
 Elige a quién basado en la situación
 Basado en la hora
 Basado en el servicio
 Basado en el estado del sistema
 Escalado
 SLA


Actuar

Si casi siempre que pasa algo hago lo mismo
¿podría programar el sistema de notificación
para que lo hiciese por mi antes de avisarme?


Reporting

 Up / Down
 Desde ...
 Vista gráfica
 Resumen y estadísticas


Tendencias

 Gráficas con los datos
 Encontrar anomalías
 Plan de crecimiento


Ciclo de mejora


¿Qué buscar?

 Fácil de configurar
 Autodetección
 GUI
 Automatizable
 Consistente
 Integración con SNMP


¿Qué buscar?

 Informe de tendencias
 Sin agente
 Plantillas
 No intrusiva
 Todo tipo de notificaciones
 Comunidad activa


Concretando


¿Qué monitorizar?
 La red
 Hardware
 Servicio
 S.O.
 Seguridad
 Un website


Hardware

 Problemas comunes
 Fallos de disco
 Fuentes de alimentación
 Memorias
 Ventiladores
 Temperatura


Hardware

 IPMI
 IPMI es un estándar que encontramos en el
hardware de muchos servidores, se trata de un
chipset que permite obtener información del estado
de diferentes componentes hardware,
temperaturas, voltajes, etc


Hardware (IPMI)

 Independiente del sistema operativo
 Es un estandard hardware
 Define mecanismos de alerta via SNMP traps


HP SIM

 Gestion de servidores HP
 Control del hardware
 EVA , XP, MSA
 Blade
 Proliant
 Integrity


HP SIM

 Soporte remoto, gestión de garantías y
contratos
 Control de SO
 Agentes propios
 Comunicación vía SNMP
 Descubrimiento automático
 Opciones para integración con terceros


S.M.A.R.T.
 Self Monitoring Analysis and Reporting
Technology consiste en la capacidad de
detección de fallos del disco duro
 detección con anticipación de los fallos en la
superficie
 realizar una copia de su contenido, o
reemplazar el disco, antes de que se produzca
una pérdida de datos irrecuperable


S.M.A.R.T.
 diferentes parámetros del disco como pueden
ser:
 Temperatura del disco
 Velocidad de lectura de datos
 Tiempo de partida (spin-up)
 Contador de sectores reasignados
 Velocidad de búsqueda
 Altura de vuelo del cabezal
 Uso de ECC y Conteo de errores

S.M.A.R.T.

 Ejemplo de monitorizacion hardware de disco
en linux con smartctl


Sensores HW

 LM Sensors desde el SO
 Demo


Virtualización

Abstracción de los recursos de una
computadora entre el hardware de la máquina
física (host) y el sistema operativo de la
máquina virtual (guest), siendo un medio para
crear una versión virtual de un dispositivo o
recurso, como un servidor, un dispositivo de
almacenamiento, una red o incluso un sistema
operativo, donde se divide el recurso en uno o
más entornos de ejecución.


vSphere

 Es el sistema mas extendido en los Data
Centers
 Nos olvidamos de algunos recursos físico a
determinado nivel pero aparecen nuevos
problemas por la consolidación


vSphere

 La virtualización ahorra tratando de aprovechar
servidores poco utilizados.
 ¿Hasta donde podemos saturar un servidor
que antes estaba infrautilizado?


vSphere


vSphere

 Usar alarmas para monitorizacion proactiva
 Pueden avisar de:
 Estado de un objeto
 Consumo de un recurso
 Avisan:
 Email
 SNMP Trap


vSphere

 Hay un monton de alarmas genericas
predefinidas
 Almacenamiento del host,estado de CPU, voltaje,
temperatura, cambio de la fuente de corriente
 Error en los clusters HA
 DS con poco espacio
 Uso de CPU por las VM, memoria, latencia de
disco


vSphere

 Condiciones para alarmas
 VM uso de memoria (%)
 VM uso de red (hbps)
 VM estado
 VM tamaño de snapshot (GB)
 VM tiempo de CPU ready (ms)
 ...


vSphere

 Acciones para alarmas
 Notificacion via email
 Trap SNMP
 Cambiar el estado de power de una VM
 Migrar la VM
 Avisar solo en el cliente vSphere


vSphere

 Trabajar con graficas de rendimiento
 Dependen del punto de vista en la jerarquia de
objetos
 VM
 HOST
 Cluster
 Datacenter


vSphere

 Tablas de los contadores disponibles para:
 Memoria
 CPU
 Disco
 Red


SNMP
 Protocolo Simple de Administración de Red
 Las versiones de SNMP más utilizadas son
SNMP versión 1 (SNMPv1) y SNMP versión 2
(SNMPv2).
 En su última versión (SNMPv3) posee cambios
significativos con relación a sus predecesores,
sobre todo en aspectos de seguridad, sin
embargo no ha sido mayoritariamente
aceptado en la industria.


SNMP componentes

 Dispositivos administrados
 Agentes
 Sistemas administradores de red (NMS’s)


SNMP Traps

 Una trap es generado por el agente para
reportar ciertas condiciones y cambios de
estado a un proceso de administración


SNMP


SNMP MIBs

 Base de información de administración
 colección de información que está organizada
jerárquicamente


Practica SNMP


RRDtool

 Herramientas para bases de datos round robin
 Las bases de datos RRD son circulares
 Una vez que se completa el circulo se generan
datos consolidados


Cacti

 Cacti es un frontend de RRDtool
 Almacena toda la informacion necesaria para
crear graficos y poblarlos con datos en una BD
MySQL
 FE en PHP


Cacti

 Data Sources
 Alimentan a Cacti via cualquier script externo para
cras las BD para generar graficos
 Soporte nativo SNMP


Cacti

 Gestion de usuarios
 Se pueden añadir usuarios que tengan derechos a
ver determinados graficos
 Plantillas
 Para definir tipos comunes de graficos
 Las plantillas de host asignan una serie de graficos
a un tipo de host


Nagios

 ¿Que es Nagios?
 Nagios es un sistema de monitorización de redes de código
abierto ampliamente utilizado, que vigila los equipos
(hardware) y servicios (software) que se especifiquen,
alertando cuando el comportamiento de los mismos no sea
el deseado. Entre sus características principales figuran la
monitorización de servicios de red (SMTP, POP3, HTTP,
SNMP...), la monitorización de los recursos de sistemas
hardware (carga del procesador, uso de los discos,
memoria, estado de los puertos...), independencia de
sistemas operativos, posibilidad de monitorización remota
mediante túneles SSL cifrados o SSH, y la posibilidad de
programar plugins específicos para nuevos sistemas.


Nagios

 ¿por qué nagios?
 Caracteristicas
 Monitorizacion de servicios


Nagios

 La ubicacion en la red del sensor es
fundamental
 El sensor monitoriza desde su propio punto de
vista
 Hay que tener en cuenta las dependencias de
la red
 No ha fallado nuestro proveedor de internet si
se nos cae el firewall


Nagios

 Según queremos monitorizar mas cosas iremos
dandole mas permisos al monitor (casi
inevitable)
 El monitor no debe generar un nuevo problema
 Hay que pensar si queremos abrir puertos en el
firewall para realizar ciertas monitorizaciones


Nagios


Nagios

 Características
 Monitorización remota, a través de túneles SSL
cifrados o SSH
 Diseño simple de plugins
 Chequeo de servicios paralizados
 Posibilidad de definir la jerarquía de la red
 Notificaciones a los contactos cuando ocurren
problemas en servicios o hosts, así como cuando
son resueltos
 Manejadores de eventos

Nagios

 ¿mirar puertos o mirar aplicaciones?
 ¿puedo conectar al puerto 80 o es mejor hacer
una petición HTTP?
 ¿vale con hacer un HTTP HEAD o con un
GET / o esperamos una respuesta concreta?


Nagios

 El silencio es oro
 En un sistema grande el número de falsas
alarmas se dispara
 Si hay demasiadas falsas alarmas se acaba
ignorando al monitor


Teoria de operaciones

 Host y servicios
 Host: es el contenedor de servicios, normalmente el
equipo físico
 Servicio: por ejemplo el demonio apache que
ejecuta una web
 Un Host suele tener varios servicio
 No se monitoriza ni se notifica un servicio si el host
que lo contiene esta mal



 Los plugins son los programas que se
encargan de verificar hosts y servicios
 Pueden ser cuaquier programa que devuelva
una códigos de retorno concretos



 Orden de comprobación



 Mecanismos de comprobación



 Las interfaces de nagios
 Web
 Event broker
 Ficheros de comandos externo



 Web



 Web
 Reporting y tendencias
 Planificar downtimes
 Habilitar y deshabilitar servicios y notificaciones
 Dibujar mapas



 Fichero de comandos externo
 FIFO
 Nagios lo chequea continuamente para controlar la
ejecucion



 Event Broker
 Es un proceso que se ejecuta y chequea la cola de
eventos de Nagios en busca de determinados
eventos y notifica a otros modulos si los detecta


Instalacion


Configuración


Configuracion

 Objetos y definiciones


Configuracion

 Periodos de tiempo


Configuracion

 Contactos


Configuración

 Grupos de contactos


Configuracion

 Host


Configuracion

 Servicios


Configuracion

 Dependencias


Configuración

 Grupos de Hosts


Configuración

 Grupos de servicios


Practica

 Instalar y configurar nagios para monitorizar un
apache remoto


Nagios, NRPE

 Qué es NRPE
 Permite ejecutar plugins locales en equipos
remotos de equipos Linux, el plugin check_nrpe es
llamado por Nagios y hace las peticiones de los
plugins hacia el equipo remoto, requiere que NRPE
este siendo ejecutado en ese equipo como un
standalone daemon o como un servicio en inetd,
tambien soporta encriptación nativa de SSL/TLS.


Nagios, NRPE

 Dos partes:
 NRPE: Se ejecuta en el host remoto, encargado
de procesar los comandos
 check_nrpe: Es el plugin que corre en el server
que ejecuta Nagios y que se comunica con el
NRPE instalado en los hosts remotos. El plugin usa
la salida de la ejecución remota y el return code
para mostrar el estado del host remoto en la
interfaz del Nagios.


Nagios, NRPE


Nagios, NRPE

 Instalacion
 Yum install nagios-plugins-nrpe


Nagios, NRPE

 Practica:
 Monitorizar la CPU de un servidor remoto usando
NRPE


Nagios, otras herramientas

 NagVis
 Plugins de visualizacion RRD


Nagios, NagVis

 Visualizacion especial


Nagios, NagVis


Nagios, RRD

 Plugins para RRD con nagios
 PNP4Nagios


Nagios, RRD

 PNP4Nagios


OpenNMS

 Producto maduro
 Monitorizacion de red de nivel empresarial
 Open Source
 Distribuido y escalable


Caracteristicas

 Polling de servicio
 Recoleccion de datos: SNMP, JMX HTTP,
WMI, JDBC, NSClient
 Evalúa los datos dependiendo de intervalis
establecidos
 Alarmas y acciones automatizadas
 Notificaciones, email, XMPP y otros
 Producto maduro y muy activo


OpenNMS

 Note: Nagios is not designed to be a
replacement for a full-blown SNMP
management application like HP OpenView or
OpenNMS.
 SNMP is anything but simple. Translating
SNMP traps and getting them into Nagios (as
passive check results) can be a bit tedious


OpenNMS


Evaluación del rendimiento

 El sistema de monitorización debe registrar la
informacion necesaria para este proposito
 Bases de datos “normales”
 Bases de datos RRD


Evaluación del rendimiento

 Normalmente es suficiente con analizar las
graficas generdas por las herramientas


Evaluación de rendimiento

 Análisis
 1) San Bernabe
 2) Algunos trabajaron el dia 10
 3) Hora punta de un dia normal
 4) Hora valle de un dia normal



 Uso de espacio de disco



 Análisis
 La ocupación es estatica
 Pequeñas variaciones que se autocorrigen hacen
que sea horizontal



 Lecturas escrituras de disco



 Análisis
 Patrón constante
 Picos muy altos y en corto espacio de tiempo
 Los picos son Lecturas
 Requiere ampliación para ver horario



 Ampliación



 1) empieza siempre a las 01:00 horas
 Tiene pinta de actividad programada



 Red



 1) picos altos y puntuales que se repiten de
forma periodica. Requiere ampliación
 1) Se mantiene aún en días festivos
 2) Actividad aparentemente normal en horario
laboral
 2) disminuye durante San Bernabe



 Correlación de red
 y disco



 Solución: son los backups del servidor.
 Se hacen de manera programada y se envían a
otro servidor donde se escriben en cintas


System Activity Report
(SAR)
 Muestra datos de rendimiento de CPU, cola de
ejecución, entrada/salida de disco, paginado
(swap), memoria, interrupciones, networking y
más
 La capacidad más importante de sar es la de
crear archivos de datos


(SAR)
 Recolecta datos de sar desde trabajos
croneados
 Proveen al administrador de sistemas de
información histórica de rendimiento


(SAR)
 Un informe básico que muestre el uso de CPU
y el porcentaje de tiempo gastado esperando
E/S
 Ejecutar sar sin argumentos
 Necesitas contar con los datos de rendimiento
de 12 horas atrás


(SAR)
 sar 5 5 indica que se deben tomar cinco
mediciones a un intervalo de cinco segundos
entre cada una.


(SAR)
 Si %idle (desocupado) está cerca de cero, tu
CPU está sobrecargada
 Si el valor %iowait (espera por e/s) es grande,
tus discos están sobrecargados de peticiones o
al menos hay un cuello de botella en la
administración de entrada/salida


(SAR)
 Para comprobar cómo se comporta el fichero
de paginación se ejecuta sar -B


(SAR)
 Análisis de paginación
 que exista un alto número de fallos mayores de
página (majflt/s) indica que el sistema necesita más
memoria


(SAR)
 Para obtener estadísticas de red, utilizamos sar
-n DEV
 Genera un informe que muestra estadísticas
con los datos transmitidos y recibidos para
cada interfaz de red


(SAR)
 comando sar -n EDEV


iostat

 monitorizar la actividad de los dispositivos,
particiones y sistemas en red (NFS) del
sistema,
 También muestra una media en % del uso de
CPU en la máquina.


iostat


iostat

 Columnas
 Device: (Dispositivo)
 tps (transferencias por segundo, cada una es una
única request de I/O al dispositivo)
 Blk_read/s (Bloques de datos leidos por segundo)
 Blk_wrtn/s (Bloques de datos escritos por segundo)
 Blk_read (Bloques totales de datos leidos)
 Blk_wrtn (Bloques totales de datos escritos por
segundo).


iostat

 Comandos típicos
 iostat -d 2
 Mostrará el reporte de dispositivos cada dos
segundos
 iostat -d 2 6
 Mostrará séis reportes con un intervalo entre
cada uno de 2 segundos
 iostat -x hda hdb 2 6
 Mostrará un reporte con estadísticas extendidas,
cada dos segundos y en séis ocasiones de los
dispositivos hda y hdb

vmstat

 Proporciona información acerca de procesos,
actividad de la CPU, memoria, paginación,
bloques de entrada salida e interrupciones.
 vmstat [delay] [counts]
 60 muestras a intervalos de 1seg: vmstat 1 60


vmstat


vmstat

 Interesante:
 Memoria: free
 CPU id: idle
 Proc r: <= número de cores
 Proc b: bloqueos E/S
 Indicadores de swap


iptraf

 Utilidad de consola para Linux que proporciona
estadísticas sobre el tráfico IP de las redes que
se encuentren activas en el sistema
 Ofrece información como el número de
paquetes y bytes en una conexión TCP,
estadísticas de una interfaz e indicadores de
actividad, caídas en el tráfico TCP/UDP y
número de bytes y paquetes en una estación
LAN


iptraf


ab

 “ab” (Apache Benchmark) sirve para hacer
pruebas de carga a un servidor apache.
 Por ejemplo 100 consultas, con una
concurrencia de 5 usuarios a la vez.
 ab -n100 -c5 http://www.sitio.com/


ab


iozone

 Herramientas benchmarking de sistema de
ficheros
 Rendimiento de I/O


iozone

 Operaciones
 Read: un fichero nuevo
 Write: un fichero nuevo
 Re-read: un fichero existente
 Re-write: un fichero existente
 Ramdon read: lectura no secuencial
 Ramdom write: escritura no secuencial
 ...


Iozone

 Iozone -a ejecuta todos los test


iozone

 Parametros y condiciones del test


iozone


iozone

 Columna 1: tamaño de fichero empleado
 Columna 2: Tamaño de registro
 Columna 3 hasta el final: el tipo de test
efectuado y las unidades por segundo de la
velocidad obtenida


JMeter

 JMeter es una herramienta de Apache
 General pero especialmente útil para web
 Desarrollado en Java


JMeter

 Ejemplo de prueba
 1) Añadiremos a nuestro plan de pruebas un grupo
de hilos, configurandolo con tantos hilos como
carga queramos dar a nuestro servidor, con un
periodo de tiempo de subida y con un limite de
ejecución de por ejemplo 10 veces


JMeter


JMeter

 2) En el menu añadir, sobre el grupo de hilos
que hemos añadido, selecionamos:
 Temporizador, Temporizador constante, al cual
configuraremos un retardo constante de 400
milisegundos, siendo el tiempo de retardo entre
cada ejecución de los hilos.


JMeter

 Muestreador, Petición http, siendo en este caso
una búsqueda en el servidor google para lo
cual configuraremos la petición con:
 Nombre de servidor: www.google.es
 Path: /webhp#q=JMeter&fp=1&cad=b


JMeter

 Dentro del muestreador:
 Aserciones, Aserción de Respuesta, que será
nuestra comprobación de que los resultados han
sido los esperados buscando en el resultado el
primer link como ejemplo:
 Main sample only
 Respuesta textual
 Contiene JMeter


JMeter

 A nuestro grupo de hilos:
 Listener, Gráfico de resultados, con el cual
podremos observar el transcurso de la prueba.
 y por ultimo Listener, ver arbol de resultados, para
poder evaluar cómodamente los resultados de cada
hilo.


JMeter

Ejecutar


Monitorizacion

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (17)

Andere mochten auch

Andere mochten auch (20)

Ähnlich wie Monitorizacion

Ähnlich wie Monitorizacion (20)

Kürzlich hochgeladen

Kürzlich hochgeladen (15)

Monitorizacion