SlideShare ist ein Scribd-Unternehmen logo
1 von 42
Downloaden Sie, um offline zu lesen
Monitoring von Messaging-Systemen via Nagios
1
Markus Thiel
Consultant
m.thiel@itnovum.de
it-novum GmbH
Edelzeller Strasse 44
36043 Fulda
www.itnovum.de
Monitoring von Messaging-Systemen via Nagios
Inhalte
Kurze Vorstellung
Nagios Werkzeuge
•Aktive checks
•Passive checks
•End2End - Vorgehensweise
MS Exchange
2
•End2End - Vorgehensweise
Monitoring
•MS Exchange
•Lotus Notes Domino
•Exim
•Postfix
Schnittstelle Munin-Nagios
•nsca / send_nsca
Fragen / Anregungen
Itnovum GmbH Geschäftsbereiche
Systemmanagement
•Open Source
•ITCOCKPIT / Nagios
Infrastruktur
Optimierung
•Storage
Management
•Security
Management
Enterprise Content
Management
•Dokumenten
Management
•Archivierung
ERP & Business
Intelligence
•Enterprise Resource
Planning
•SAP
3
•Server Virtualisierung
•Client Virtualisierung
•Outsourcing
•Reporting, Analyse &
Dashboards
Big picture
IT Prozesse
Incident-
Management
Problem
Management
Service Lev.
Management
BusinessSicht
Business Service
Monitoring
Business Service
Dashboard SLA-Monitoring
Eventmanagement und Korrelation
BP-Monitoring
4
Capacity
Management
Configuration
Management
Change
Management
CMDB
TechnischeSicht
Release
Management
Server Netzwerke Datenbanken Middleware Anwendungen Integration
Schwellwerte Status E2E
Monitoring
Performancedaten
Monitoring
Alarmierung
Nagios – Werkzeuge
passive checkspassive checks
CIaktive checks CI
5
Weitere Werkzeuge
Kommerzielle
Tools
Hersteller-
spezifische
Tools
Open Source
Tools
z.B. …
Nagios - Aktive checks
check _nrpe
check _nt
check _by_ssh
TCP/IP
6
Eigene Plugins
CIcheck _snmp TCP/IP
TCP/IP
check _ldap
check_smtp
…
check _tcp
check_tcp -H $HOSTADDRESS$ -p 25 -s HELO ich -e 250 OK -q quit -w $ARG1$-c $ARG2$
End2End Monitoring 1
7
End2End Monitoring 2
Standortabhängig
8
• check_ldap
• check_tcp
• check_pop3
• …
Exchange Monitoring - Methoden
Exchange Server
25
110
389
…
check _nt
Prozesse
Perfmon
9
check _tcp
check …
…
Exchange Monitoring – Vorbereitung CI
• Installation nsclient++
• Auslesen der Parameter aus dem Performance Counter
(perfmon)
10
Exchange Monitoring – Nagios Konfig
• Installation check_nt (nagios-plugins)
• Anpassen der Nagios Konfiguration
check_nt -H <HOST> -s <PASSWORD> 
-p <PORT> -v COUNTER 
-l "SMTP Server(_Total)Gesamtzahl übermittelter Nachrichten"
Command-Definition
11
Übergabe der
Leistungsindikatoren,
Instanzen und
Leistungsobjekte als
Argument
Exchange Monitoring – Nagios Konfig
• Option A
Konfiguration ohne Schwellwert
12
Exchange Monitoring – Nagios Konfig
• Option B
Konfiguration mit Schwellwert
wrapper um check_nt bauen; die Schwellwerte werden dabei als
Argument übergeben
#!/bin/bash
…
RETVAL=0
TEMPFILE="/tmp/${HOST}_unzustellbarkeitsberichte"
TIME=`date +%s`
13
TIME=`date +%s`
RES=`$PLUGINDIR/check_nt -H <HOST> -s <PASSWORD> -p <PORT> -v COUNTER -l 
"SMTP Server(_Total)Erzeugte NDRs (Unzustellbarkeitsberichte)"`
if [ -e $TEMPFILE ];then
ALTRES=`cat $TEMPFILE|grep "Wert ="|cut -d '=' -f2`
ALTTIME=`cat $TEMPFILE|grep "Time ="|cut -d '=' -f2`
else
ALTRES=$RES
ALTTIME=$TIME
fi
echo "Wert =${RES}" > $TEMPFILE
echo "Time =${TIME}" >> $TEMPFILE
RES=`echo "${RES}-${ALTRES}"|bc -l`;
TIME=`echo "${TIME}-${ALTTIME}"|bc -l`;
RES=`echo "${RES}/${TIME}*60"|bc -l`;
if [ $RES -ge $WARN ]; then
RETVAL=1
fi
if [ $RES -ge $CRIT ]; then
RETVAL=2
fi
RETSTR="Erzeugte NDR pro Min : ${RES}|NDRs=${RES}NDRs_per_min;$WARN;$CRIT„
echo $RETSTR
exit $RETVAL
Exchange Monitoring – Nagios Konfig
• Option B
Konfiguration mit Schwellwert
Pluginausgabe:
14
Exchange Monitoring – weitere Parameter
Erzeugte NDR
Nicht zustallbare Nachrichten
Angemeldete Benutzer
Warteschlangen
…
15
Shot: MS Exchange 2007
Exchange Monitoring – Prozessabfrage
• Auszug relevanter Prozesse
check_nt -H <HOST> -s <PASSWORD> 
-p <PORT> -v PROCSTATE
-l STORE.EXE
• Prozess-Status auslesen
16
MSExchange-Informationsspeicher
store.exe
MSExchange-Systemaufsicht
mad.exe
MSExchange-Verwaltung
exmgmt.exe
MSExchangeRoutingModul
inetinfo.exe
MSExchangeMTA-Stacks
emsmta.exe
Exchange Monitoring – NagVis
17
Lotus Notes Domino - Methoden
Domino-Server
LNSNMP
QuerySet Handler
Event Interceptor
QuerySet Handler
fragt die Statistikinformationen des Server ab
und gibt diese an den LNSNMP ab, der diese
Informationen an den plattformspezifischen
SNMP Agent übergibt
18
Event Interceptor
weist den LNSNMP an, zB einen snmp-trap
abzusetzen
LNSNMP
• Unterstützte Plattformen
z/OS
(OS 390)
19
• Nicht unterstützte Plattformen
zSeries
Lotus Notes Domino – Vorbereitung CI
• Installation / Konfiguration SNMP
• Installation LNSNMP
20
LND Monitoring – Methode 1 (passiv)
Domino-Server
LNSNMP
Event Interceptor
21
snmptrap in Echtzeit
LND Monitoring – Methode 2 (aktiv)
Domino-Server
1152
25
389
…
LNSNMP
QuerySet Handler
22
check _tcp
check …
…
check _snmp
LND Monitoring – passive vs aktive checks
Anforderung Passive check Active check
Snapshot View
Konfigurationsaufwand
Systemübergreifende Eventkorrelation
Klare Servicezuordnung
SLA tauglich
23
BPM tauglich
Differenzierung der Events beim Ausfall mehrerer Komponenten
Tiefergehende Applikationsüberwachung
Performancedaten / Langzeitanalyse
LND Monitoring – Standard check_snmp
• Installation check_snmp (nagios-plugins)
• Anpassen der Nagios Konfiguration
check_snmp 
–H <HOSTNAME> 
-C <COMUNNUNITY> 
-o 1.3.6.1.4.1.334.72.1.1.4.3.0 
-l LN_TOTAL_MAIL_FAILURES 
-w <WARNING_THRESHOLD> 
Command-Definition
24
-w <WARNING_THRESHOLD> 
-c <CRITICAL_THRESHOLD> 
-u Mails
Pluginoutput
LN_TOTAL_MAIL_FAILURES OK - 1 Mails | iso.3.6.1.4.1.334.72.1.1.4.3.0=1
LND Monitoring – OIDs from MIB
Service OID Description from MIB
dead-mail enterprises.334.72.1.1.4.1.0 Number of dead (undeliverable) mail messages
routing-failures enterprises.334.72.1.1.4.3.0 Total number of routing failures since the server started
pending-routing enterprises.334.72.1.1.4.6.0 Number of mail messages waiting to be routed
pending-local enterprises.334.72.1.1.4.7.0 Number of pending mail messages awaiting local delivery
max-mail-delivery-time enterprises.334.72.1.1.4.12.0 Maximum time for mail delivery in seconds
25
router-unable-to-transfer enterprises.334.72.1.1.4.19.0 Number of mail messages the router was unable to transfer
mail-held-in-queue enterprises.334.72.1.1.4.21.0 Number of mail messages in message queue on hold
mails-pending enterprises.334.72.1.1.4.31.0 Number of mail messages pending
replicator-status enterprises.334.72.1.1.6.1.3.0 Status of the Replicator task
router-status enterprises.334.72.1.1.6.1.4.0 Status of the Router task
databases-in-cache enterprises.334.72.1.1.10.15.0 The number of databases currently in the cache. Administrators should
monitor this number to see whether it approaches the
NSF_DBCACHE_MAXENTRIES setting. If it does, this indicates the cache is
under pressure. If this situation occurs frequently, the administrator should
increase the setting for NSF_DBCACHE_MAXENTRIES
LND Monitoring – OIDs from MIB 2
Service OID Description from MIB
messages-send enterprises.334.72.1.1.4.2.0 Number of messges received by router
messages-routed enterprises.334.72.1.1.4.4.0 Total number of mail messages routed since the server started
router-messages-attempted-to-
transfer
enterprises.334.72.1.1.4.5.0 Number of messages router attempted to transfer
delivered-mail-size-avg enterprises.334.72.1.1.4.11.0 Average size of mail messages delivered in bytes
delivered-mail-size-max enterprises.334.72.1.1.4.14.0 Maximum size of mail delivered in bytes
26
total-mail-transferred enterprises.334.72.1.1.4.18.0 Total mail transferred in kilobytes
transferred-per-min-peak enterprises.334.72.1.1.4.27.0 Peak number of messages transferred
…
MemAllocProcess enterprises.334.72.1.1.9.2 Total process-private memory allocated by all currently-running
processes.
DriveFree enterprises.334.72.1.1.8.3.1.4 The amount of free space left on this drive in kilobytes.
A value of zero may indicate the statistic's value is
too large to be passed via SNMP.
Lotus Notes Domino – Dienste checken
• Installation check_lotus_notes_services plugin *
nsgios-server:~ # snmpwalk -c <COMMUNITY> -v 1 <HOSTADRESS> .1.3.6.1.4.1.334.72.1.1.6.1.2.1.4 
| awk -F"STRING: " '{ print $2 }' | sort | uniq
…
"Statistic Collector“
"Event Interceptor“
"QuerySet Handler“
"Cluster Replicator“
…
• Übergabe der Ergebnisse als Argument im command
• Auslesen der gestarteten Dienste auf dem LND Server
27
• Übergabe der Ergebnisse als Argument im command
nagios-server:<PLUGINDIR> # ./check_lotus_notes_services.sh -H <HOSTNAME> 
-S “Event Interceptor” 
-C <SNMP COMMUNITY>
OK - "Idle: [07/10/2008 13:34:08 CEDT]“ | Counter=1Services
Lotus Notes Domino – Transfer Peak Time
• Nagios Plugin:
check_lotus_notes_transfer_per_minute_peak_time *
#!/bin/bash
…
UNIXTIME=`snmpwalk -c <COMMUNITY> -v 1 <HOSTNAME> 1.3.6.1.4.1.334.72.1.1.6.3.4.0 
| awk -F"INTEGER: " '{ print $2 }'`
HUMANTIME=`echo $UNIXTIME | logtime`
…
Umrechnung UNIX-Timestamp in
Format YYYY-MM-DD hh:mm:ss
28
Format YYYY-MM-DD hh:mm:ss
• logtime *:
Installation in $PATH des users nagios
• Ausgabe im Webfrontend
Lotus Notes Domino – Cluster Index *
Node 1, 2, 3, …
check_lotus_notes_cluster_index.sh 
-H <HOSTNAME>
-C <SNMP COMMUNITY>
-w <WARNING THRESHOLD>
-c <CRITICAL THRESHOLD>
Domino Cluster
29
LND Cluster Monitoring – OIDs from MIB
Service OID Description from MIB
ClusterTransRunningAvgTime 1.3.6.1.4.1.334.72.1.1.6.4.10.6 Average total running time of cluster transactions.
ClusterTransRunningAvgTime 1.3.6.1.4.1.334.72.1.1.6.4.10.7 Average total running time of cluster transactions.
ClusterTransRunningCount 1.3.6.1.4.1.334.72.1.1.6.4.10.8 Number of cluster transactions.
ClusterTransRunningTime 1.3.6.1.4.1.334.72.1.1.6.4.10.9 Total running time of cluster transactions.
ClusterProbeError 1.3.6.1.4.1.334.72.1.1.6.4.11 The number of times a server received an error while
probing another server.
30
…
Exim / Postfix - Methoden
Mailserver
25
110
…
check _by_ssh
nrpe
ssh
check _nrpe
nagios-plugins
31
check _tcp
check …
Exim / Postfix Plugins
check_exim_mailq_adv -f <exim-config-file> -w <warning queue size> -c <critical queue size>
• check_exim_mailq_adv *
• check_exim_input **
• check_postfix **
• check_postfix_queue **
32
• check_postfix_queue **
Munin - Funktionsweise
Der Munin-Server sammelt Leistungsdaten von im Netzwerk verteilten
Computern, speichert diese, und stellt die Daten mittels Webinterface
graphisch dar. Die Speicherung der Messwerte geschieht mit Hilfe von Tobi
Oetikers RRD Tool. ***
1. Serverseitig muss der
munin-node
munin-plugins
CI
33
munin-server:/var# telnet 192.168.0.105 4949
Trying 192.168.0.105...
Connected to 192.168.0.105.
Escape character is '^]'.
# munin node at mfe01.itnovum.de
bla
# Unknown command. Try list, nodes, config, fetch, version or quit
list
memory df cpu exim_mailstats swap exim_mailqueue load
fetch load
load.value 1.39
.
3. Testen einer Munin-Konfiguration
1. Serverseitig muss der
CI in der munin.conf
eingetragen sein
2. Client-seitig muss der
Munin-Server in der
munin-node.conf
eingetragen sein
CI
Munin Plugins
munin-node:/etc/munin/plugins# ls -al
insgesamt 2
…
lrwxrwxrwx 1 root root 28 2006-03-06 20:03 cpu -> /usr/share/munin/plugins/cpu
lrwxrwxrwx 1 root root 27 2006-03-06 20:03 df -> /usr/share/munin/plugins/df
…
lrwxrwxrwx 1 root root 39 2006-03-06 20:03 exim_mailqueue -> /usr/share/munin/plugins/exim_mailqueue
lrwxrwxrwx 1 root root 39 2006-03-06 20:03 exim_mailstats -> /usr/share/munin/plugins/exim_mailstats
…
lrwxrwxrwx 1 root root 43 2006-03-06 20:03 postfix_mailvolume -> /usr/share/munin/plugins/postfix_mailvolume
…
• Standard-Plugins im filesystem
34
• Im www
http://muninexchange.projects.linpro.no/
Munin – Schwellwerte
Definition von Schwellwerten in dem ensprechenden munin-plugin
munin-node:/etc/munin/plugins# grep -E 'QUEUE.*=.*0' exim_mailqueue
QUEUEWARN=100
QUEUECRIT=200
Darstellung im Webfrontend
Stati – Nagios like
35
Stati – Nagios like
OK || Warning || Critical
Munin – Nagios Schnittstelle
Mailserver
Server
36
Mailserver
munin-node
munin-plugins CI
nsca
Munin – Nagios Schnittstellenkonfig 1
• Installation
• send_nsca (Munin-Server)
• nsca (Nagios Server)
• nagios.cfg Nagios-Server
…
check_external_commands=1
…
37
• send_nsca.cfg Munin-Server
…
password=secret
encryption_method=1
…
• nsca.cfg am Nagios-Server
…
password=secret
encryption_method=1
…
Munin – Nagios Schnittstellenkonfig 2
• munin.conf anpassen (Munin-Server)
#!/bin/bash
…
# For those with Nagios, the following might come in handy. In addition,
# the services must be defined in the Nagios server as well.
contact.nagios.command /usr/sbin/send_nsca -H nagios-server -c /etc/send_nsca.cfg
• Auslesen des graph title aus dem munin-plugin (Munin-Server)
38
GRAPHTITLE='Exim Mailqueue'
echo "graph_title $GRAPHTITLE“
…
• Definition des Services als Passive Service (Nagios-Server)
define service{
use passive-service
host_name mgmt05.itnovum.de
service_description Exim Mailqueue
}
Munin – Nagios Schnittstellenkonfig 3
Munin-Server
munin-server:~# printf "%st%st%st%sn" "mgmt05.itnovum.de" "Exim Mailqueue" "0" "ALLES OK" 
| /usr/sbin/send_nsca -H <NAGIOSSERVER> -c /etc/nsca.cfg
1 data packet(s) sent to host successfully.
Nagios-Server
• Valedierung der Konfiguration
39
nagios-server:<PATH_NAGIOS_LOG># tail -f nagios.log | logtime
[2008-09-06 18:47:34] PASSIVE SERVICE CHECK: mgmt05.itnovum.de;Exim Mailqueue;0;ALLES OK
• Nagios-Frontend
Quellen
* www.itnovum.de
** www.nagiosexchange.org
*** www.de.wikipedia.org [Stand 01.09.2008]
40
Monitoring von Messaging-Systemen via Nagios
Fragen ?
41
42
Vielen Dank für
Ihre Aufmerksamkeit

Weitere ähnliche Inhalte

Ähnlich wie OSMC 2008 | Monitoring von Messaging Systemen mit Nagios by Markus Thiel

Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)
Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)
Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)NETWAYS
 
Citrix Day 2013: Citirx Networking
Citrix Day 2013: Citirx NetworkingCitrix Day 2013: Citirx Networking
Citrix Day 2013: Citirx NetworkingDigicomp Academy AG
 
Domino 12(.0.2) Lessons learned - DNUG Stammtisch Hamburg
Domino 12(.0.2) Lessons learned - DNUG Stammtisch HamburgDomino 12(.0.2) Lessons learned - DNUG Stammtisch Hamburg
Domino 12(.0.2) Lessons learned - DNUG Stammtisch HamburgDNUG e.V.
 
Domino Statistiken verstehen und nutzen (Teil 1) - 41. DNUG Konferenz
Domino Statistiken verstehen und nutzen (Teil 1) - 41. DNUG KonferenzDomino Statistiken verstehen und nutzen (Teil 1) - 41. DNUG Konferenz
Domino Statistiken verstehen und nutzen (Teil 1) - 41. DNUG Konferenzpanagenda
 
OSMC 2008 | Monitoring Microsoft SQL Server by Michael Streb
OSMC 2008 | Monitoring Microsoft SQL Server by Michael StrebOSMC 2008 | Monitoring Microsoft SQL Server by Michael Streb
OSMC 2008 | Monitoring Microsoft SQL Server by Michael StrebNETWAYS
 
OSMC 2010 | Monitoring mit Shinken by Gerhard Laußer
OSMC 2010 | Monitoring mit Shinken by Gerhard LaußerOSMC 2010 | Monitoring mit Shinken by Gerhard Laußer
OSMC 2010 | Monitoring mit Shinken by Gerhard LaußerNETWAYS
 
The Best Things in Life Are Free – Wie Sie Ihre IBM ConnecEons Umgebung koste...
The Best Things in Life Are Free – Wie Sie Ihre IBM ConnecEons Umgebung koste...The Best Things in Life Are Free – Wie Sie Ihre IBM ConnecEons Umgebung koste...
The Best Things in Life Are Free – Wie Sie Ihre IBM ConnecEons Umgebung koste...Klaus Bild
 
Prometheus Monitoring
Prometheus MonitoringPrometheus Monitoring
Prometheus Monitoringinovex GmbH
 
Grundlagen puppet
Grundlagen puppetGrundlagen puppet
Grundlagen puppetinovex GmbH
 
Sicheres Root-Server Hosting mit Linux
Sicheres Root-Server Hosting mit LinuxSicheres Root-Server Hosting mit Linux
Sicheres Root-Server Hosting mit Linuxmarkusmarkert
 
Kritische app performance erfolgreich optimieren mit Bison
Kritische app performance erfolgreich optimieren mit BisonKritische app performance erfolgreich optimieren mit Bison
Kritische app performance erfolgreich optimieren mit BisonDynatrace
 
Microsoft Teams Performance Optimierung - Kennen Sie Ihre Daten
Microsoft Teams Performance Optimierung - Kennen Sie Ihre DatenMicrosoft Teams Performance Optimierung - Kennen Sie Ihre Daten
Microsoft Teams Performance Optimierung - Kennen Sie Ihre Datenpanagenda
 
Server Überwachung mit Icinga 2 (Webinar vom 15. Februar 2017)
Server Überwachung mit Icinga 2 (Webinar vom 15. Februar 2017)Server Überwachung mit Icinga 2 (Webinar vom 15. Februar 2017)
Server Überwachung mit Icinga 2 (Webinar vom 15. Februar 2017)NETWAYS
 
System Center Configuration Manager with Azure, Intune and Application Manage...
System Center Configuration Manager with Azure, Intune and Application Manage...System Center Configuration Manager with Azure, Intune and Application Manage...
System Center Configuration Manager with Azure, Intune and Application Manage...Digicomp Academy AG
 
OSMC 2010 | Clientless Windows Monitoring über WMI mit Samba4 by Thomas Sesse...
OSMC 2010 | Clientless Windows Monitoring über WMI mit Samba4 by Thomas Sesse...OSMC 2010 | Clientless Windows Monitoring über WMI mit Samba4 by Thomas Sesse...
OSMC 2010 | Clientless Windows Monitoring über WMI mit Samba4 by Thomas Sesse...NETWAYS
 
SE-Live 2013: Embeddable Process Engines mit BPMN 2.0
SE-Live 2013: Embeddable Process Engines mit BPMN 2.0SE-Live 2013: Embeddable Process Engines mit BPMN 2.0
SE-Live 2013: Embeddable Process Engines mit BPMN 2.0camunda services GmbH
 
Camunda Community Day_Wiener BPM Offensive
Camunda Community Day_Wiener BPM OffensiveCamunda Community Day_Wiener BPM Offensive
Camunda Community Day_Wiener BPM Offensivecamunda services GmbH
 
ANEO | Automatisierung mit RedHat Ansible
ANEO | Automatisierung mit RedHat AnsibleANEO | Automatisierung mit RedHat Ansible
ANEO | Automatisierung mit RedHat AnsibleCarolineAuerMarcher
 
Norbert Rieger – IT-Tage 2015 – Optimierung der Performance bei Oracle-Datenb...
Norbert Rieger – IT-Tage 2015 – Optimierung der Performance bei Oracle-Datenb...Norbert Rieger – IT-Tage 2015 – Optimierung der Performance bei Oracle-Datenb...
Norbert Rieger – IT-Tage 2015 – Optimierung der Performance bei Oracle-Datenb...Informatik Aktuell
 
Betriebsdatenerfassung einer Dimplex Wärmepumpe vom Typ LA 40TU
Betriebsdatenerfassung einer Dimplex Wärmepumpe vom Typ LA 40TUBetriebsdatenerfassung einer Dimplex Wärmepumpe vom Typ LA 40TU
Betriebsdatenerfassung einer Dimplex Wärmepumpe vom Typ LA 40TUJohannes Kinzig
 

Ähnlich wie OSMC 2008 | Monitoring von Messaging Systemen mit Nagios by Markus Thiel (20)

Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)
Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)
Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)
 
Citrix Day 2013: Citirx Networking
Citrix Day 2013: Citirx NetworkingCitrix Day 2013: Citirx Networking
Citrix Day 2013: Citirx Networking
 
Domino 12(.0.2) Lessons learned - DNUG Stammtisch Hamburg
Domino 12(.0.2) Lessons learned - DNUG Stammtisch HamburgDomino 12(.0.2) Lessons learned - DNUG Stammtisch Hamburg
Domino 12(.0.2) Lessons learned - DNUG Stammtisch Hamburg
 
Domino Statistiken verstehen und nutzen (Teil 1) - 41. DNUG Konferenz
Domino Statistiken verstehen und nutzen (Teil 1) - 41. DNUG KonferenzDomino Statistiken verstehen und nutzen (Teil 1) - 41. DNUG Konferenz
Domino Statistiken verstehen und nutzen (Teil 1) - 41. DNUG Konferenz
 
OSMC 2008 | Monitoring Microsoft SQL Server by Michael Streb
OSMC 2008 | Monitoring Microsoft SQL Server by Michael StrebOSMC 2008 | Monitoring Microsoft SQL Server by Michael Streb
OSMC 2008 | Monitoring Microsoft SQL Server by Michael Streb
 
OSMC 2010 | Monitoring mit Shinken by Gerhard Laußer
OSMC 2010 | Monitoring mit Shinken by Gerhard LaußerOSMC 2010 | Monitoring mit Shinken by Gerhard Laußer
OSMC 2010 | Monitoring mit Shinken by Gerhard Laußer
 
The Best Things in Life Are Free – Wie Sie Ihre IBM ConnecEons Umgebung koste...
The Best Things in Life Are Free – Wie Sie Ihre IBM ConnecEons Umgebung koste...The Best Things in Life Are Free – Wie Sie Ihre IBM ConnecEons Umgebung koste...
The Best Things in Life Are Free – Wie Sie Ihre IBM ConnecEons Umgebung koste...
 
Prometheus Monitoring
Prometheus MonitoringPrometheus Monitoring
Prometheus Monitoring
 
Grundlagen puppet
Grundlagen puppetGrundlagen puppet
Grundlagen puppet
 
Sicheres Root-Server Hosting mit Linux
Sicheres Root-Server Hosting mit LinuxSicheres Root-Server Hosting mit Linux
Sicheres Root-Server Hosting mit Linux
 
Kritische app performance erfolgreich optimieren mit Bison
Kritische app performance erfolgreich optimieren mit BisonKritische app performance erfolgreich optimieren mit Bison
Kritische app performance erfolgreich optimieren mit Bison
 
Microsoft Teams Performance Optimierung - Kennen Sie Ihre Daten
Microsoft Teams Performance Optimierung - Kennen Sie Ihre DatenMicrosoft Teams Performance Optimierung - Kennen Sie Ihre Daten
Microsoft Teams Performance Optimierung - Kennen Sie Ihre Daten
 
Server Überwachung mit Icinga 2 (Webinar vom 15. Februar 2017)
Server Überwachung mit Icinga 2 (Webinar vom 15. Februar 2017)Server Überwachung mit Icinga 2 (Webinar vom 15. Februar 2017)
Server Überwachung mit Icinga 2 (Webinar vom 15. Februar 2017)
 
System Center Configuration Manager with Azure, Intune and Application Manage...
System Center Configuration Manager with Azure, Intune and Application Manage...System Center Configuration Manager with Azure, Intune and Application Manage...
System Center Configuration Manager with Azure, Intune and Application Manage...
 
OSMC 2010 | Clientless Windows Monitoring über WMI mit Samba4 by Thomas Sesse...
OSMC 2010 | Clientless Windows Monitoring über WMI mit Samba4 by Thomas Sesse...OSMC 2010 | Clientless Windows Monitoring über WMI mit Samba4 by Thomas Sesse...
OSMC 2010 | Clientless Windows Monitoring über WMI mit Samba4 by Thomas Sesse...
 
SE-Live 2013: Embeddable Process Engines mit BPMN 2.0
SE-Live 2013: Embeddable Process Engines mit BPMN 2.0SE-Live 2013: Embeddable Process Engines mit BPMN 2.0
SE-Live 2013: Embeddable Process Engines mit BPMN 2.0
 
Camunda Community Day_Wiener BPM Offensive
Camunda Community Day_Wiener BPM OffensiveCamunda Community Day_Wiener BPM Offensive
Camunda Community Day_Wiener BPM Offensive
 
ANEO | Automatisierung mit RedHat Ansible
ANEO | Automatisierung mit RedHat AnsibleANEO | Automatisierung mit RedHat Ansible
ANEO | Automatisierung mit RedHat Ansible
 
Norbert Rieger – IT-Tage 2015 – Optimierung der Performance bei Oracle-Datenb...
Norbert Rieger – IT-Tage 2015 – Optimierung der Performance bei Oracle-Datenb...Norbert Rieger – IT-Tage 2015 – Optimierung der Performance bei Oracle-Datenb...
Norbert Rieger – IT-Tage 2015 – Optimierung der Performance bei Oracle-Datenb...
 
Betriebsdatenerfassung einer Dimplex Wärmepumpe vom Typ LA 40TU
Betriebsdatenerfassung einer Dimplex Wärmepumpe vom Typ LA 40TUBetriebsdatenerfassung einer Dimplex Wärmepumpe vom Typ LA 40TU
Betriebsdatenerfassung einer Dimplex Wärmepumpe vom Typ LA 40TU
 

Kürzlich hochgeladen

Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...DNUG e.V.
 
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...DNUG e.V.
 
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die Cloud
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die CloudFrom Zero to still Zero: Die schönsten Fehler auf dem Weg in die Cloud
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die CloudOPEN KNOWLEDGE GmbH
 
Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...
Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...
Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...OPEN KNOWLEDGE GmbH
 
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data Imputation
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data ImputationFEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data Imputation
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data ImputationOPEN KNOWLEDGE GmbH
 
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...Markus Unterauer
 

Kürzlich hochgeladen (6)

Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
 
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
 
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die Cloud
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die CloudFrom Zero to still Zero: Die schönsten Fehler auf dem Weg in die Cloud
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die Cloud
 
Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...
Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...
Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...
 
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data Imputation
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data ImputationFEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data Imputation
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data Imputation
 
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...
 

OSMC 2008 | Monitoring von Messaging Systemen mit Nagios by Markus Thiel

  • 1. Monitoring von Messaging-Systemen via Nagios 1 Markus Thiel Consultant m.thiel@itnovum.de it-novum GmbH Edelzeller Strasse 44 36043 Fulda www.itnovum.de
  • 2. Monitoring von Messaging-Systemen via Nagios Inhalte Kurze Vorstellung Nagios Werkzeuge •Aktive checks •Passive checks •End2End - Vorgehensweise MS Exchange 2 •End2End - Vorgehensweise Monitoring •MS Exchange •Lotus Notes Domino •Exim •Postfix Schnittstelle Munin-Nagios •nsca / send_nsca Fragen / Anregungen
  • 3. Itnovum GmbH Geschäftsbereiche Systemmanagement •Open Source •ITCOCKPIT / Nagios Infrastruktur Optimierung •Storage Management •Security Management Enterprise Content Management •Dokumenten Management •Archivierung ERP & Business Intelligence •Enterprise Resource Planning •SAP 3 •Server Virtualisierung •Client Virtualisierung •Outsourcing •Reporting, Analyse & Dashboards
  • 4. Big picture IT Prozesse Incident- Management Problem Management Service Lev. Management BusinessSicht Business Service Monitoring Business Service Dashboard SLA-Monitoring Eventmanagement und Korrelation BP-Monitoring 4 Capacity Management Configuration Management Change Management CMDB TechnischeSicht Release Management Server Netzwerke Datenbanken Middleware Anwendungen Integration Schwellwerte Status E2E Monitoring Performancedaten Monitoring Alarmierung
  • 5. Nagios – Werkzeuge passive checkspassive checks CIaktive checks CI 5 Weitere Werkzeuge Kommerzielle Tools Hersteller- spezifische Tools Open Source Tools z.B. …
  • 6. Nagios - Aktive checks check _nrpe check _nt check _by_ssh TCP/IP 6 Eigene Plugins CIcheck _snmp TCP/IP TCP/IP check _ldap check_smtp … check _tcp check_tcp -H $HOSTADDRESS$ -p 25 -s HELO ich -e 250 OK -q quit -w $ARG1$-c $ARG2$
  • 8. End2End Monitoring 2 Standortabhängig 8 • check_ldap • check_tcp • check_pop3 • …
  • 9. Exchange Monitoring - Methoden Exchange Server 25 110 389 … check _nt Prozesse Perfmon 9 check _tcp check … …
  • 10. Exchange Monitoring – Vorbereitung CI • Installation nsclient++ • Auslesen der Parameter aus dem Performance Counter (perfmon) 10
  • 11. Exchange Monitoring – Nagios Konfig • Installation check_nt (nagios-plugins) • Anpassen der Nagios Konfiguration check_nt -H <HOST> -s <PASSWORD> -p <PORT> -v COUNTER -l "SMTP Server(_Total)Gesamtzahl übermittelter Nachrichten" Command-Definition 11 Übergabe der Leistungsindikatoren, Instanzen und Leistungsobjekte als Argument
  • 12. Exchange Monitoring – Nagios Konfig • Option A Konfiguration ohne Schwellwert 12
  • 13. Exchange Monitoring – Nagios Konfig • Option B Konfiguration mit Schwellwert wrapper um check_nt bauen; die Schwellwerte werden dabei als Argument übergeben #!/bin/bash … RETVAL=0 TEMPFILE="/tmp/${HOST}_unzustellbarkeitsberichte" TIME=`date +%s` 13 TIME=`date +%s` RES=`$PLUGINDIR/check_nt -H <HOST> -s <PASSWORD> -p <PORT> -v COUNTER -l "SMTP Server(_Total)Erzeugte NDRs (Unzustellbarkeitsberichte)"` if [ -e $TEMPFILE ];then ALTRES=`cat $TEMPFILE|grep "Wert ="|cut -d '=' -f2` ALTTIME=`cat $TEMPFILE|grep "Time ="|cut -d '=' -f2` else ALTRES=$RES ALTTIME=$TIME fi echo "Wert =${RES}" > $TEMPFILE echo "Time =${TIME}" >> $TEMPFILE RES=`echo "${RES}-${ALTRES}"|bc -l`; TIME=`echo "${TIME}-${ALTTIME}"|bc -l`; RES=`echo "${RES}/${TIME}*60"|bc -l`; if [ $RES -ge $WARN ]; then RETVAL=1 fi if [ $RES -ge $CRIT ]; then RETVAL=2 fi RETSTR="Erzeugte NDR pro Min : ${RES}|NDRs=${RES}NDRs_per_min;$WARN;$CRIT„ echo $RETSTR exit $RETVAL
  • 14. Exchange Monitoring – Nagios Konfig • Option B Konfiguration mit Schwellwert Pluginausgabe: 14
  • 15. Exchange Monitoring – weitere Parameter Erzeugte NDR Nicht zustallbare Nachrichten Angemeldete Benutzer Warteschlangen … 15 Shot: MS Exchange 2007
  • 16. Exchange Monitoring – Prozessabfrage • Auszug relevanter Prozesse check_nt -H <HOST> -s <PASSWORD> -p <PORT> -v PROCSTATE -l STORE.EXE • Prozess-Status auslesen 16 MSExchange-Informationsspeicher store.exe MSExchange-Systemaufsicht mad.exe MSExchange-Verwaltung exmgmt.exe MSExchangeRoutingModul inetinfo.exe MSExchangeMTA-Stacks emsmta.exe
  • 18. Lotus Notes Domino - Methoden Domino-Server LNSNMP QuerySet Handler Event Interceptor QuerySet Handler fragt die Statistikinformationen des Server ab und gibt diese an den LNSNMP ab, der diese Informationen an den plattformspezifischen SNMP Agent übergibt 18 Event Interceptor weist den LNSNMP an, zB einen snmp-trap abzusetzen
  • 19. LNSNMP • Unterstützte Plattformen z/OS (OS 390) 19 • Nicht unterstützte Plattformen zSeries
  • 20. Lotus Notes Domino – Vorbereitung CI • Installation / Konfiguration SNMP • Installation LNSNMP 20
  • 21. LND Monitoring – Methode 1 (passiv) Domino-Server LNSNMP Event Interceptor 21 snmptrap in Echtzeit
  • 22. LND Monitoring – Methode 2 (aktiv) Domino-Server 1152 25 389 … LNSNMP QuerySet Handler 22 check _tcp check … … check _snmp
  • 23. LND Monitoring – passive vs aktive checks Anforderung Passive check Active check Snapshot View Konfigurationsaufwand Systemübergreifende Eventkorrelation Klare Servicezuordnung SLA tauglich 23 BPM tauglich Differenzierung der Events beim Ausfall mehrerer Komponenten Tiefergehende Applikationsüberwachung Performancedaten / Langzeitanalyse
  • 24. LND Monitoring – Standard check_snmp • Installation check_snmp (nagios-plugins) • Anpassen der Nagios Konfiguration check_snmp –H <HOSTNAME> -C <COMUNNUNITY> -o 1.3.6.1.4.1.334.72.1.1.4.3.0 -l LN_TOTAL_MAIL_FAILURES -w <WARNING_THRESHOLD> Command-Definition 24 -w <WARNING_THRESHOLD> -c <CRITICAL_THRESHOLD> -u Mails Pluginoutput LN_TOTAL_MAIL_FAILURES OK - 1 Mails | iso.3.6.1.4.1.334.72.1.1.4.3.0=1
  • 25. LND Monitoring – OIDs from MIB Service OID Description from MIB dead-mail enterprises.334.72.1.1.4.1.0 Number of dead (undeliverable) mail messages routing-failures enterprises.334.72.1.1.4.3.0 Total number of routing failures since the server started pending-routing enterprises.334.72.1.1.4.6.0 Number of mail messages waiting to be routed pending-local enterprises.334.72.1.1.4.7.0 Number of pending mail messages awaiting local delivery max-mail-delivery-time enterprises.334.72.1.1.4.12.0 Maximum time for mail delivery in seconds 25 router-unable-to-transfer enterprises.334.72.1.1.4.19.0 Number of mail messages the router was unable to transfer mail-held-in-queue enterprises.334.72.1.1.4.21.0 Number of mail messages in message queue on hold mails-pending enterprises.334.72.1.1.4.31.0 Number of mail messages pending replicator-status enterprises.334.72.1.1.6.1.3.0 Status of the Replicator task router-status enterprises.334.72.1.1.6.1.4.0 Status of the Router task databases-in-cache enterprises.334.72.1.1.10.15.0 The number of databases currently in the cache. Administrators should monitor this number to see whether it approaches the NSF_DBCACHE_MAXENTRIES setting. If it does, this indicates the cache is under pressure. If this situation occurs frequently, the administrator should increase the setting for NSF_DBCACHE_MAXENTRIES
  • 26. LND Monitoring – OIDs from MIB 2 Service OID Description from MIB messages-send enterprises.334.72.1.1.4.2.0 Number of messges received by router messages-routed enterprises.334.72.1.1.4.4.0 Total number of mail messages routed since the server started router-messages-attempted-to- transfer enterprises.334.72.1.1.4.5.0 Number of messages router attempted to transfer delivered-mail-size-avg enterprises.334.72.1.1.4.11.0 Average size of mail messages delivered in bytes delivered-mail-size-max enterprises.334.72.1.1.4.14.0 Maximum size of mail delivered in bytes 26 total-mail-transferred enterprises.334.72.1.1.4.18.0 Total mail transferred in kilobytes transferred-per-min-peak enterprises.334.72.1.1.4.27.0 Peak number of messages transferred … MemAllocProcess enterprises.334.72.1.1.9.2 Total process-private memory allocated by all currently-running processes. DriveFree enterprises.334.72.1.1.8.3.1.4 The amount of free space left on this drive in kilobytes. A value of zero may indicate the statistic's value is too large to be passed via SNMP.
  • 27. Lotus Notes Domino – Dienste checken • Installation check_lotus_notes_services plugin * nsgios-server:~ # snmpwalk -c <COMMUNITY> -v 1 <HOSTADRESS> .1.3.6.1.4.1.334.72.1.1.6.1.2.1.4 | awk -F"STRING: " '{ print $2 }' | sort | uniq … "Statistic Collector“ "Event Interceptor“ "QuerySet Handler“ "Cluster Replicator“ … • Übergabe der Ergebnisse als Argument im command • Auslesen der gestarteten Dienste auf dem LND Server 27 • Übergabe der Ergebnisse als Argument im command nagios-server:<PLUGINDIR> # ./check_lotus_notes_services.sh -H <HOSTNAME> -S “Event Interceptor” -C <SNMP COMMUNITY> OK - "Idle: [07/10/2008 13:34:08 CEDT]“ | Counter=1Services
  • 28. Lotus Notes Domino – Transfer Peak Time • Nagios Plugin: check_lotus_notes_transfer_per_minute_peak_time * #!/bin/bash … UNIXTIME=`snmpwalk -c <COMMUNITY> -v 1 <HOSTNAME> 1.3.6.1.4.1.334.72.1.1.6.3.4.0 | awk -F"INTEGER: " '{ print $2 }'` HUMANTIME=`echo $UNIXTIME | logtime` … Umrechnung UNIX-Timestamp in Format YYYY-MM-DD hh:mm:ss 28 Format YYYY-MM-DD hh:mm:ss • logtime *: Installation in $PATH des users nagios • Ausgabe im Webfrontend
  • 29. Lotus Notes Domino – Cluster Index * Node 1, 2, 3, … check_lotus_notes_cluster_index.sh -H <HOSTNAME> -C <SNMP COMMUNITY> -w <WARNING THRESHOLD> -c <CRITICAL THRESHOLD> Domino Cluster 29
  • 30. LND Cluster Monitoring – OIDs from MIB Service OID Description from MIB ClusterTransRunningAvgTime 1.3.6.1.4.1.334.72.1.1.6.4.10.6 Average total running time of cluster transactions. ClusterTransRunningAvgTime 1.3.6.1.4.1.334.72.1.1.6.4.10.7 Average total running time of cluster transactions. ClusterTransRunningCount 1.3.6.1.4.1.334.72.1.1.6.4.10.8 Number of cluster transactions. ClusterTransRunningTime 1.3.6.1.4.1.334.72.1.1.6.4.10.9 Total running time of cluster transactions. ClusterProbeError 1.3.6.1.4.1.334.72.1.1.6.4.11 The number of times a server received an error while probing another server. 30 …
  • 31. Exim / Postfix - Methoden Mailserver 25 110 … check _by_ssh nrpe ssh check _nrpe nagios-plugins 31 check _tcp check …
  • 32. Exim / Postfix Plugins check_exim_mailq_adv -f <exim-config-file> -w <warning queue size> -c <critical queue size> • check_exim_mailq_adv * • check_exim_input ** • check_postfix ** • check_postfix_queue ** 32 • check_postfix_queue **
  • 33. Munin - Funktionsweise Der Munin-Server sammelt Leistungsdaten von im Netzwerk verteilten Computern, speichert diese, und stellt die Daten mittels Webinterface graphisch dar. Die Speicherung der Messwerte geschieht mit Hilfe von Tobi Oetikers RRD Tool. *** 1. Serverseitig muss der munin-node munin-plugins CI 33 munin-server:/var# telnet 192.168.0.105 4949 Trying 192.168.0.105... Connected to 192.168.0.105. Escape character is '^]'. # munin node at mfe01.itnovum.de bla # Unknown command. Try list, nodes, config, fetch, version or quit list memory df cpu exim_mailstats swap exim_mailqueue load fetch load load.value 1.39 . 3. Testen einer Munin-Konfiguration 1. Serverseitig muss der CI in der munin.conf eingetragen sein 2. Client-seitig muss der Munin-Server in der munin-node.conf eingetragen sein CI
  • 34. Munin Plugins munin-node:/etc/munin/plugins# ls -al insgesamt 2 … lrwxrwxrwx 1 root root 28 2006-03-06 20:03 cpu -> /usr/share/munin/plugins/cpu lrwxrwxrwx 1 root root 27 2006-03-06 20:03 df -> /usr/share/munin/plugins/df … lrwxrwxrwx 1 root root 39 2006-03-06 20:03 exim_mailqueue -> /usr/share/munin/plugins/exim_mailqueue lrwxrwxrwx 1 root root 39 2006-03-06 20:03 exim_mailstats -> /usr/share/munin/plugins/exim_mailstats … lrwxrwxrwx 1 root root 43 2006-03-06 20:03 postfix_mailvolume -> /usr/share/munin/plugins/postfix_mailvolume … • Standard-Plugins im filesystem 34 • Im www http://muninexchange.projects.linpro.no/
  • 35. Munin – Schwellwerte Definition von Schwellwerten in dem ensprechenden munin-plugin munin-node:/etc/munin/plugins# grep -E 'QUEUE.*=.*0' exim_mailqueue QUEUEWARN=100 QUEUECRIT=200 Darstellung im Webfrontend Stati – Nagios like 35 Stati – Nagios like OK || Warning || Critical
  • 36. Munin – Nagios Schnittstelle Mailserver Server 36 Mailserver munin-node munin-plugins CI nsca
  • 37. Munin – Nagios Schnittstellenkonfig 1 • Installation • send_nsca (Munin-Server) • nsca (Nagios Server) • nagios.cfg Nagios-Server … check_external_commands=1 … 37 • send_nsca.cfg Munin-Server … password=secret encryption_method=1 … • nsca.cfg am Nagios-Server … password=secret encryption_method=1 …
  • 38. Munin – Nagios Schnittstellenkonfig 2 • munin.conf anpassen (Munin-Server) #!/bin/bash … # For those with Nagios, the following might come in handy. In addition, # the services must be defined in the Nagios server as well. contact.nagios.command /usr/sbin/send_nsca -H nagios-server -c /etc/send_nsca.cfg • Auslesen des graph title aus dem munin-plugin (Munin-Server) 38 GRAPHTITLE='Exim Mailqueue' echo "graph_title $GRAPHTITLE“ … • Definition des Services als Passive Service (Nagios-Server) define service{ use passive-service host_name mgmt05.itnovum.de service_description Exim Mailqueue }
  • 39. Munin – Nagios Schnittstellenkonfig 3 Munin-Server munin-server:~# printf "%st%st%st%sn" "mgmt05.itnovum.de" "Exim Mailqueue" "0" "ALLES OK" | /usr/sbin/send_nsca -H <NAGIOSSERVER> -c /etc/nsca.cfg 1 data packet(s) sent to host successfully. Nagios-Server • Valedierung der Konfiguration 39 nagios-server:<PATH_NAGIOS_LOG># tail -f nagios.log | logtime [2008-09-06 18:47:34] PASSIVE SERVICE CHECK: mgmt05.itnovum.de;Exim Mailqueue;0;ALLES OK • Nagios-Frontend
  • 40. Quellen * www.itnovum.de ** www.nagiosexchange.org *** www.de.wikipedia.org [Stand 01.09.2008] 40
  • 41. Monitoring von Messaging-Systemen via Nagios Fragen ? 41
  • 42. 42 Vielen Dank für Ihre Aufmerksamkeit