5. ¿Qué es monitorizar?
La monitorización es un proceso que Hace
referencia a la supervisión necesaria para la
ejecución del plan de acción establecido en la
planificacion
Fernando Arconada Oróstegui
6. ¿Qué es monitorizar?
La monitorización puede detectar las posibles
interferencias que pudieran presentarse en el
curso de alguna acción y puede dar lugar a
corregir el procedimiento antes de llegar a un
resultado final.
Fernando Arconada Oróstegui
7. Pasos previos
Análisis detallado del sistema informático a
monitorizar
Detectar los sistemas críticos (tanto máquinas
como servicios)
Formular políticas de actuación frente a
incidencias
Fernando Arconada Oróstegui
8. 3 reglas
1- Mantener las medidas de seguridad existentes.
Fernando Arconada Oróstegui
14. Comprobar el estado
Comprobar limites
Comprobar si se ejecuta
¿una pagina web que tarda 2 minutos en responder
podemos considerar que funciona bien?
Fernando Arconada Oróstegui
15. Cómo comprobar el estado
Script
Ficheros de estado
Agentes
SNMP
Fernando Arconada Oróstegui
16. Con o sin Agente
Basado en agente
Impacto sobre la medida
Información mas detallada
Suelen tener mayor impacto en el rendimiento
Fernando Arconada Oróstegui
17. Con o sin Agente
Sin agente
No son intrusivos
Menos detalle
Fernando Arconada Oróstegui
18. Con o sin Agente
SNMP
Es algo intermedio, una especie de agente ligero
Fernando Arconada Oróstegui
20. Alertas y notificaciones
Envía una señal de alarma
Email, SMS, XMPP, otros
Elige a quién basado en la situación
Basado en la hora
Basado en el servicio
Basado en el estado del sistema
Escalado
SLA
Fernando Arconada Oróstegui
21. Actuar
Si casi siempre que pasa algo hago lo mismo
¿podría programar el sistema de notificación
para que lo hiciese por mi antes de avisarme?
Fernando Arconada Oróstegui
27. ¿Qué buscar?
Fácil de configurar
Autodetección
GUI
Automatizable
Consistente
Integración con SNMP
Fernando Arconada Oróstegui
28. ¿Qué buscar?
Informe de tendencias
Sin agente
Plantillas
No intrusiva
Todo tipo de notificaciones
Comunidad activa
Fernando Arconada Oróstegui
33. Hardware
Problemas comunes
Fallos de disco
Fuentes de alimentación
Memorias
Ventiladores
Temperatura
Fernando Arconada Oróstegui
34. Hardware
IPMI
IPMI es un estándar que encontramos en el
hardware de muchos servidores, se trata de un
chipset que permite obtener información del estado
de diferentes componentes hardware,
temperaturas, voltajes, etc
Fernando Arconada Oróstegui
35. Hardware (IPMI)
Independiente del sistema operativo
Es un estandard hardware
Define mecanismos de alerta via SNMP traps
Fernando Arconada Oróstegui
36. HP SIM
Gestion de servidores HP
Control del hardware
EVA , XP, MSA
Blade
Proliant
Integrity
Fernando Arconada Oróstegui
37. HP SIM
Soporte remoto, gestión de garantías y
contratos
Control de SO
Agentes propios
Comunicación vía SNMP
Descubrimiento automático
Opciones para integración con terceros
Fernando Arconada Oróstegui
38. S.M.A.R.T.
Self Monitoring Analysis and Reporting
Technology consiste en la capacidad de
detección de fallos del disco duro
detección con anticipación de los fallos en la
superficie
realizar una copia de su contenido, o
reemplazar el disco, antes de que se produzca
una pérdida de datos irrecuperable
Fernando Arconada Oróstegui
39. S.M.A.R.T.
diferentes parámetros del disco como pueden
ser:
Temperatura del disco
Velocidad de lectura de datos
Tiempo de partida (spin-up)
Contador de sectores reasignados
Velocidad de búsqueda
Altura de vuelo del cabezal
Uso de ECC y Conteo de errores
Fernando Arconada Oróstegui
40. S.M.A.R.T.
Ejemplo de monitorizacion hardware de disco
en linux con smartctl
Fernando Arconada Oróstegui
41. Sensores HW
LM Sensors desde el SO
Demo
Fernando Arconada Oróstegui
43. Virtualización
Abstracción de los recursos de una
computadora entre el hardware de la máquina
física (host) y el sistema operativo de la
máquina virtual (guest), siendo un medio para
crear una versión virtual de un dispositivo o
recurso, como un servidor, un dispositivo de
almacenamiento, una red o incluso un sistema
operativo, donde se divide el recurso en uno o
más entornos de ejecución.
Fernando Arconada Oróstegui
44. vSphere
Es el sistema mas extendido en los Data
Centers
Nos olvidamos de algunos recursos físico a
determinado nivel pero aparecen nuevos
problemas por la consolidación
Fernando Arconada Oróstegui
45. vSphere
La virtualización ahorra tratando de aprovechar
servidores poco utilizados.
¿Hasta donde podemos saturar un servidor
que antes estaba infrautilizado?
Fernando Arconada Oróstegui
48. vSphere
Usar alarmas para monitorizacion proactiva
Pueden avisar de:
Estado de un objeto
Consumo de un recurso
Avisan:
Email
SNMP Trap
Fernando Arconada Oróstegui
50. vSphere
Hay un monton de alarmas genericas
predefinidas
Almacenamiento del host,estado de CPU, voltaje,
temperatura, cambio de la fuente de corriente
Error en los clusters HA
DS con poco espacio
Uso de CPU por las VM, memoria, latencia de
disco
Fernando Arconada Oróstegui
52. vSphere
Condiciones para alarmas
VM uso de memoria (%)
VM uso de red (hbps)
VM estado
VM tamaño de snapshot (GB)
VM tiempo de CPU ready (ms)
...
Fernando Arconada Oróstegui
53. vSphere
Acciones para alarmas
Notificacion via email
Trap SNMP
Cambiar el estado de power de una VM
Migrar la VM
Avisar solo en el cliente vSphere
Fernando Arconada Oróstegui
54. vSphere
Trabajar con graficas de rendimiento
Dependen del punto de vista en la jerarquia de
objetos
VM
HOST
Cluster
Datacenter
Fernando Arconada Oróstegui
63. SNMP
Protocolo Simple de Administración de Red
Las versiones de SNMP más utilizadas son
SNMP versión 1 (SNMPv1) y SNMP versión 2
(SNMPv2).
En su última versión (SNMPv3) posee cambios
significativos con relación a sus predecesores,
sobre todo en aspectos de seguridad, sin
embargo no ha sido mayoritariamente
aceptado en la industria.
Fernando Arconada Oróstegui
64. SNMP componentes
Dispositivos administrados
Agentes
Sistemas administradores de red (NMS’s)
Fernando Arconada Oróstegui
65. SNMP Traps
Una trap es generado por el agente para
reportar ciertas condiciones y cambios de
estado a un proceso de administración
Fernando Arconada Oróstegui
71. RRDtool
Herramientas para bases de datos round robin
Las bases de datos RRD son circulares
Una vez que se completa el circulo se generan
datos consolidados
Fernando Arconada Oróstegui
72. Cacti
Cacti es un frontend de RRDtool
Almacena toda la informacion necesaria para
crear graficos y poblarlos con datos en una BD
MySQL
FE en PHP
Fernando Arconada Oróstegui
73. Cacti
Data Sources
Alimentan a Cacti via cualquier script externo para
cras las BD para generar graficos
Soporte nativo SNMP
Fernando Arconada Oróstegui
74. Cacti
Gestion de usuarios
Se pueden añadir usuarios que tengan derechos a
ver determinados graficos
Plantillas
Para definir tipos comunes de graficos
Las plantillas de host asignan una serie de graficos
a un tipo de host
Fernando Arconada Oróstegui
75.
76. Nagios
¿Que es Nagios?
Nagios es un sistema de monitorización de redes de código
abierto ampliamente utilizado, que vigila los equipos
(hardware) y servicios (software) que se especifiquen,
alertando cuando el comportamiento de los mismos no sea
el deseado. Entre sus características principales figuran la
monitorización de servicios de red (SMTP, POP3, HTTP,
SNMP...), la monitorización de los recursos de sistemas
hardware (carga del procesador, uso de los discos,
memoria, estado de los puertos...), independencia de
sistemas operativos, posibilidad de monitorización remota
mediante túneles SSL cifrados o SSH, y la posibilidad de
programar plugins específicos para nuevos sistemas.
Fernando Arconada Oróstegui
77. Nagios
¿por qué nagios?
Caracteristicas
Monitorizacion de servicios
Fernando Arconada Oróstegui
78. Nagios
La ubicacion en la red del sensor es
fundamental
El sensor monitoriza desde su propio punto de
vista
Hay que tener en cuenta las dependencias de
la red
No ha fallado nuestro proveedor de internet si
se nos cae el firewall
Fernando Arconada Oróstegui
79. Nagios
Según queremos monitorizar mas cosas iremos
dandole mas permisos al monitor (casi
inevitable)
El monitor no debe generar un nuevo problema
Hay que pensar si queremos abrir puertos en el
firewall para realizar ciertas monitorizaciones
Fernando Arconada Oróstegui
81. Nagios
Características
Monitorización remota, a través de túneles SSL
cifrados o SSH
Diseño simple de plugins
Chequeo de servicios paralizados
Posibilidad de definir la jerarquía de la red
Notificaciones a los contactos cuando ocurren
problemas en servicios o hosts, así como cuando
son resueltos
Manejadores de eventos
Fernando Arconada Oróstegui
82. Nagios
¿mirar puertos o mirar aplicaciones?
¿puedo conectar al puerto 80 o es mejor hacer
una petición HTTP?
¿vale con hacer un HTTP HEAD o con un
GET / o esperamos una respuesta concreta?
Fernando Arconada Oróstegui
83. Nagios
El silencio es oro
En un sistema grande el número de falsas
alarmas se dispara
Si hay demasiadas falsas alarmas se acaba
ignorando al monitor
Fernando Arconada Oróstegui
84. Teoria de operaciones
Host y servicios
Host: es el contenedor de servicios, normalmente el
equipo físico
Servicio: por ejemplo el demonio apache que
ejecuta una web
Un Host suele tener varios servicio
No se monitoriza ni se notifica un servicio si el host
que lo contiene esta mal
Fernando Arconada Oróstegui
85. Teoria de operaciones
Los plugins son los programas que se
encargan de verificar hosts y servicios
Pueden ser cuaquier programa que devuelva
una códigos de retorno concretos
Fernando Arconada Oróstegui
96. Teoria de operaciones
Web
Reporting y tendencias
Planificar downtimes
Habilitar y deshabilitar servicios y notificaciones
Dibujar mapas
Fernando Arconada Oróstegui
97. Teoria de operaciones
Fichero de comandos externo
FIFO
Nagios lo chequea continuamente para controlar la
ejecucion
Fernando Arconada Oróstegui
98. Teoria de operaciones
Event Broker
Es un proceso que se ejecuta y chequea la cola de
eventos de Nagios en busca de determinados
eventos y notifica a otros modulos si los detecta
Fernando Arconada Oróstegui
108. Configuración
Grupos de Hosts
Fernando Arconada Oróstegui
109. Configuración
Grupos de servicios
Fernando Arconada Oróstegui
110. Practica
Instalar y configurar nagios para monitorizar un
apache remoto
Fernando Arconada Oróstegui
111. Nagios, NRPE
Qué es NRPE
Permite ejecutar plugins locales en equipos
remotos de equipos Linux, el plugin check_nrpe es
llamado por Nagios y hace las peticiones de los
plugins hacia el equipo remoto, requiere que NRPE
este siendo ejecutado en ese equipo como un
standalone daemon o como un servicio en inetd,
tambien soporta encriptación nativa de SSL/TLS.
Fernando Arconada Oróstegui
112. Nagios, NRPE
Dos partes:
NRPE: Se ejecuta en el host remoto, encargado
de procesar los comandos
check_nrpe: Es el plugin que corre en el server
que ejecuta Nagios y que se comunica con el
NRPE instalado en los hosts remotos. El plugin usa
la salida de la ejecución remota y el return code
para mostrar el estado del host remoto en la
interfaz del Nagios.
Fernando Arconada Oróstegui
121. Nagios, RRD
Plugins para RRD con nagios
PNP4Nagios
Fernando Arconada Oróstegui
122. Nagios, RRD
PNP4Nagios
Fernando Arconada Oróstegui
123. OpenNMS
Producto maduro
Monitorizacion de red de nivel empresarial
Open Source
Distribuido y escalable
Fernando Arconada Oróstegui
124. Caracteristicas
Polling de servicio
Recoleccion de datos: SNMP, JMX HTTP,
WMI, JDBC, NSClient
Evalúa los datos dependiendo de intervalis
establecidos
Alarmas y acciones automatizadas
Notificaciones, email, XMPP y otros
Producto maduro y muy activo
Fernando Arconada Oróstegui
125. OpenNMS
Note: Nagios is not designed to be a
replacement for a full-blown SNMP
management application like HP OpenView or
OpenNMS.
SNMP is anything but simple. Translating
SNMP traps and getting them into Nagios (as
passive check results) can be a bit tedious
Fernando Arconada Oróstegui
131. Evaluación del rendimiento
El sistema de monitorización debe registrar la
informacion necesaria para este proposito
Bases de datos “normales”
Bases de datos RRD
Fernando Arconada Oróstegui
132. Evaluación del rendimiento
Normalmente es suficiente con analizar las
graficas generdas por las herramientas
Fernando Arconada Oróstegui
133. Evaluación de rendimiento
Análisis
1) San Bernabe
2) Algunos trabajaron el dia 10
3) Hora punta de un dia normal
4) Hora valle de un dia normal
Fernando Arconada Oróstegui
135. Evaluación de rendimiento
Análisis
La ocupación es estatica
Pequeñas variaciones que se autocorrigen hacen
que sea horizontal
Fernando Arconada Oróstegui
137. Evaluación de rendimiento
Análisis
Patrón constante
Picos muy altos y en corto espacio de tiempo
Los picos son Lecturas
Requiere ampliación para ver horario
Fernando Arconada Oróstegui
141. Evaluación de rendimiento
1) picos altos y puntuales que se repiten de
forma periodica. Requiere ampliación
1) Se mantiene aún en días festivos
2) Actividad aparentemente normal en horario
laboral
2) disminuye durante San Bernabe
Fernando Arconada Oróstegui
145. Evaluación de rendimiento
Solución: son los backups del servidor.
Se hacen de manera programada y se envían a
otro servidor donde se escriben en cintas
Fernando Arconada Oróstegui
146. System Activity Report
(SAR)
Muestra datos de rendimiento de CPU, cola de
ejecución, entrada/salida de disco, paginado
(swap), memoria, interrupciones, networking y
más
La capacidad más importante de sar es la de
crear archivos de datos
Fernando Arconada Oróstegui
147. System Activity Report
(SAR)
Recolecta datos de sar desde trabajos
croneados
Proveen al administrador de sistemas de
información histórica de rendimiento
Fernando Arconada Oróstegui
148. System Activity Report
(SAR)
Un informe básico que muestre el uso de CPU
y el porcentaje de tiempo gastado esperando
E/S
Ejecutar sar sin argumentos
Necesitas contar con los datos de rendimiento
de 12 horas atrás
Fernando Arconada Oróstegui
149. System Activity Report
(SAR)
sar 5 5 indica que se deben tomar cinco
mediciones a un intervalo de cinco segundos
entre cada una.
Fernando Arconada Oróstegui
150. System Activity Report
(SAR)
Si %idle (desocupado) está cerca de cero, tu
CPU está sobrecargada
Si el valor %iowait (espera por e/s) es grande,
tus discos están sobrecargados de peticiones o
al menos hay un cuello de botella en la
administración de entrada/salida
Fernando Arconada Oróstegui
151. System Activity Report
(SAR)
Para comprobar cómo se comporta el fichero
de paginación se ejecuta sar -B
Fernando Arconada Oróstegui
152. System Activity Report
(SAR)
Análisis de paginación
que exista un alto número de fallos mayores de
página (majflt/s) indica que el sistema necesita más
memoria
Fernando Arconada Oróstegui
153. System Activity Report
(SAR)
Para obtener estadísticas de red, utilizamos sar
-n DEV
Genera un informe que muestra estadísticas
con los datos transmitidos y recibidos para
cada interfaz de red
Fernando Arconada Oróstegui
155. iostat
monitorizar la actividad de los dispositivos,
particiones y sistemas en red (NFS) del
sistema,
También muestra una media en % del uso de
CPU en la máquina.
Fernando Arconada Oróstegui
157. iostat
Columnas
Device: (Dispositivo)
tps (transferencias por segundo, cada una es una
única request de I/O al dispositivo)
Blk_read/s (Bloques de datos leidos por segundo)
Blk_wrtn/s (Bloques de datos escritos por segundo)
Blk_read (Bloques totales de datos leidos)
Blk_wrtn (Bloques totales de datos escritos por
segundo).
Fernando Arconada Oróstegui
158. iostat
Comandos típicos
iostat -d 2
Mostrará el reporte de dispositivos cada dos
segundos
iostat -d 2 6
Mostrará séis reportes con un intervalo entre
cada uno de 2 segundos
iostat -x hda hdb 2 6
Mostrará un reporte con estadísticas extendidas,
cada dos segundos y en séis ocasiones de los
dispositivos hda y hdb
Fernando Arconada Oróstegui
159. vmstat
Proporciona información acerca de procesos,
actividad de la CPU, memoria, paginación,
bloques de entrada salida e interrupciones.
vmstat [delay] [counts]
60 muestras a intervalos de 1seg: vmstat 1 60
Fernando Arconada Oróstegui
162. vmstat
Interesante:
Memoria: free
CPU id: idle
Proc r: <= número de cores
Proc b: bloqueos E/S
Indicadores de swap
Fernando Arconada Oróstegui
163. iptraf
Utilidad de consola para Linux que proporciona
estadísticas sobre el tráfico IP de las redes que
se encuentren activas en el sistema
Ofrece información como el número de
paquetes y bytes en una conexión TCP,
estadísticas de una interfaz e indicadores de
actividad, caídas en el tráfico TCP/UDP y
número de bytes y paquetes en una estación
LAN
Fernando Arconada Oróstegui
166. ab
“ab” (Apache Benchmark) sirve para hacer
pruebas de carga a un servidor apache.
Por ejemplo 100 consultas, con una
concurrencia de 5 usuarios a la vez.
ab -n100 -c5 http://www.sitio.com/
Fernando Arconada Oróstegui
168. iozone
Herramientas benchmarking de sistema de
ficheros
Rendimiento de I/O
Fernando Arconada Oróstegui
169. iozone
Operaciones
Read: un fichero nuevo
Write: un fichero nuevo
Re-read: un fichero existente
Re-write: un fichero existente
Ramdon read: lectura no secuencial
Ramdom write: escritura no secuencial
...
Fernando Arconada Oróstegui
170. Iozone
Iozone -a ejecuta todos los test
Fernando Arconada Oróstegui
171. iozone
Parametros y condiciones del test
Fernando Arconada Oróstegui
173. iozone
Columna 1: tamaño de fichero empleado
Columna 2: Tamaño de registro
Columna 3 hasta el final: el tipo de test
efectuado y las unidades por segundo de la
velocidad obtenida
Fernando Arconada Oróstegui
174. JMeter
JMeter es una herramienta de Apache
General pero especialmente útil para web
Desarrollado en Java
Fernando Arconada Oróstegui
175. JMeter
Ejemplo de prueba
1) Añadiremos a nuestro plan de pruebas un grupo
de hilos, configurandolo con tantos hilos como
carga queramos dar a nuestro servidor, con un
periodo de tiempo de subida y con un limite de
ejecución de por ejemplo 10 veces
Fernando Arconada Oróstegui
177. JMeter
2) En el menu añadir, sobre el grupo de hilos
que hemos añadido, selecionamos:
Temporizador, Temporizador constante, al cual
configuraremos un retardo constante de 400
milisegundos, siendo el tiempo de retardo entre
cada ejecución de los hilos.
Fernando Arconada Oróstegui
178. JMeter
Muestreador, Petición http, siendo en este caso
una búsqueda en el servidor google para lo
cual configuraremos la petición con:
Nombre de servidor: www.google.es
Path: /webhp#q=JMeter&fp=1&cad=b
Fernando Arconada Oróstegui
179. JMeter
Dentro del muestreador:
Aserciones, Aserción de Respuesta, que será
nuestra comprobación de que los resultados han
sido los esperados buscando en el resultado el
primer link como ejemplo:
Main sample only
Respuesta textual
Contiene JMeter
Fernando Arconada Oróstegui
180. JMeter
A nuestro grupo de hilos:
Listener, Gráfico de resultados, con el cual
podremos observar el transcurso de la prueba.
y por ultimo Listener, ver arbol de resultados, para
poder evaluar cómodamente los resultados de cada
hilo.
Fernando Arconada Oróstegui