SlideShare ist ein Scribd-Unternehmen logo
1 von 25
Downloaden Sie, um offline zu lesen
Fallstudie – Nagios bei MIT 21.09.2006 1Tobias MuckeMAN IT Services GmbH
Fallstudie – Nagios bei MIT
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 2Tobias Mucke
Vorstellung - MAN IT Services GmbH
IT Dienstleister für die MAN Gruppe
Gründung als eigenständige GmbH in 2005, Betrieb ab
Januar 2006
10 Standorte
320 Mitarbeiter
Geschäftsfelder
RZ Infrastruktur und Betrieb
Entwicklung teilkonzernübergreifender Anwendungen
Beratung
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 3Tobias Mucke
Vorstellung - Referent
MIT Enterprise Engineering – Linux Systemadministration
derzeit etwa 200 Linux basierte Systeme
Projekte
Standardisierung der Linux Enterprise Server Umgebung
Zentrales und automatisiertes Deployment für die Systeminstallation,
-konfiguration und -wartung
Hochverfügbarkeit
Hardware- und Systemmonitoring mit Nagios
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 4Tobias Mucke
Gliederung (1)
I. Begriffsabgrenzung
II. Einführung in das Spannungsverhältnis zwischen der
1. Heterogenität der Monitoring Infrastruktur vor Nagios
2. Homogenität der Linux Infrastruktur
III. Projektziele und -rahmen
…
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 5Tobias Mucke
Gliederung (2)
IV. Nagios Monitoring Infrastruktur
1. Grundlegende Entscheidungen und Konfigurationsansätze
2. Infrastrukturüberblick
3. In Zahlen
V. Plugins
VI. Auswertung der Performancedaten
VII. Rückblick - Ein Jahr Nagios
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 6Tobias Mucke
Begriffsabgrenzung - Monitoring
Hardwaremonitoring
Lüfter, Netzteile, HDDs, Memorymodule, Temperaturen usw.
Systemmonitoring
Dateisysteme, Prozesse, Arbeitsspeicher usw.
Netzwerk- und Basisdienstemonitoring
Netzwerkkomponenten, DNS, Webserver, Oracle Datenbanken
Status: GRGRÜÜNN, GELBGELB oder ROTROT z.B. zur Alarmierung / Eskalation
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 7Tobias Mucke
Begriffsabgrenzung – Messung von Performancedaten
Kurz-, mittel- und langfristige Aufzeichnung von Messwerten
Einsatz unterschiedlicher Messmethoden (Pegelstände,
Zähler, Differenzen usw. )
Einheit des Messergebnisses (Sekunden, Grad, Bytes usw.)
Geeignete Verdichtung über die Zeit
Messwerte: Grafische Darstellung in Diagrammen z.B.
zur Trendanalyse / Planung
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 8Tobias Mucke
Monitoring Infrastruktur vor Nagios
Intranet DMZ Internet
Firewall
Firewall
Skripte
Bigbrother Cacti
Messwerte
Cacti
Messwerte
Bigbrother
HW
Alarme
HW
Alarme
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 9Tobias Mucke
Homogenität der Linux Infrastruktur
Hoher Standardisierungsgrad der Systeme
Drei- bis vierschichtige Infrastrukturkonzepte
Hoher Anteil von in Farmen (60%) / Clustern (20%)
organisierter Systeme
Starke Homogenität der Systeme,
kaum (< 10%) Einzelsysteme
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 10Tobias Mucke
Spannungsverhältnis
Heterogenität der Monitoring Infrastruktur
vs.
Homogentität der Linux Infrastruktur
Neukonzeptionierung der Monitoring Infrastruktur
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 11Tobias Mucke
Primäre Projektziele
1. Konsolidierung
2. Zentralisierung
3. Verfügbarkeit
4. Kostensenkung
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 12Tobias Mucke
Sekundäre Projektziele
1. Skalierbarkeit
2. Integration
3. Flexibilisierung
4. Paradigmenwechsel
5. Standardisierung
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 13Tobias Mucke
Projektrahmen
Zeit
Implementierung der Basisinfrastruktur durch Michael Frank im
Rahmen des ersten Praxissemester FH Augsburg (20 Wochen)
Budget
Nutzung bereits vorhandener Ressourcen, kein eigenes Budget
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 14Tobias Mucke
Entscheidungsfindung Nagios
Szenarien
Zentrales Network Monitoring System
Distributed Monitoring Server
HA Network Monitoring
Skalierbarkeit
Konsolidierung und Integration
Flexibilität
Weiche Faktoren
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 15Tobias Mucke
Nagios Infrastruktur
Intranet DMZ Internet
Firewall
Firewall
Messwerte
NMS
Messwerte
Mailserver / Ticketsystem
NRPE
NRPE
SSH
NSCA
Config
Deploy
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 16Tobias Mucke
In Zahlen
HA NMS mit jeweils 2 CPUs à 3.00 GHz und 2 GB Memory
3x DMS mit jeweils 2 CPUs à 3.00 GHz und 2 GB Memory
Etwa 200 Systeme
Knapp 5500 Checks
Knapp 5300 RRD Datenbanken
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 17Tobias Mucke
Plugins - Überblick
Standardplugins aus dem Nagios Plugin Development Projekt
Ergänzende Plugins von Nagios Exchange
Einige selbst geschriebene Plugins
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 18Tobias Mucke
Plugins - Hardwaremonitoring
Herstellerspezifische Agenten
SNMP Traps an SNMPTRAPD
SNMPTRAPD übergibt Traps an SNMP Trap Translator
Weitermeldung an NMS durch passiven Check
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 19Tobias Mucke
Plugins - Systemmonitoring (1)
Monitoring für MD und DRBD
check_md
check_drbd
Statistiken interner Kernelcaches (Slabinfo)
check_slabstat
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 20Tobias Mucke
Plugins - Systemmonitoring (2)
Monitoring der NRPE daemons
check_nrpe
Monitoring der Systemzeit
check_ntp
DNS Einträge in der Vorwärts- und Rückwärtsauflösung
check_dns
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 21Tobias Mucke
Plugins - Nagios
Monitoring des Nagios Systems: check_nagios
Statistiken: check_nagios_stats
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 22Tobias Mucke
Plugins - Sonstiges
RPC und NFS Statistiken (Server / Client)
check_rpcstat
check_nfsstat
Monitoring HTTP Server und SSL Zertifikate
check_http
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 23Tobias Mucke
Performancedaten mit RRD
Auswertung der Plugin Performancedaten
Kurz-,
Mittel- und
Langfristig
Nutzung des bestehenden RRDTool Know Hows
Umgehung des Flaschenhals beim Weitergeben der
Performancedaten
Maximale Flexibilität beim Erstellen und Anzeigen der Daten
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 24Tobias Mucke
Sammlung und Auswertung der Performancedaten
Übergabe der Performancedaten durch Nagios mittels einer
Datei
Regelmäßiger Aufruf von Nagiosgraph
Nagiosgraph zur Erstellung und Pflege der RRDs
Nagiostat und Drraw zur Anzeige / Dashboards
Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 25Tobias Mucke
Rückblick nach einem Jahr Nagios
Einteilung der Zeitrechnung in eine Zeit vor und nach
Nagios
Projektziele
Konsolidierung und Zentralisierung
Skalierbarkeit und Verfügbarkeit
Integration
Kostensenkung
Standardisierung

Weitere ähnliche Inhalte

Ähnlich wie Nagios Conference 2006 | Nagios - Fallstudie bei der MAN IT Services GmbH by Tobias Mucke

Steinzeit war gestern! Wege der Cloud-nativen Evolution.
Steinzeit war gestern! Wege der Cloud-nativen Evolution.Steinzeit war gestern! Wege der Cloud-nativen Evolution.
Steinzeit war gestern! Wege der Cloud-nativen Evolution.QAware GmbH
 
DevOps in der Praxis
DevOps in der PraxisDevOps in der Praxis
DevOps in der Praxisinovex GmbH
 
Servicierung von Monolithen - Der Weg zu neuen Technologien bis hin zum Servi...
Servicierung von Monolithen - Der Weg zu neuen Technologien bis hin zum Servi...Servicierung von Monolithen - Der Weg zu neuen Technologien bis hin zum Servi...
Servicierung von Monolithen - Der Weg zu neuen Technologien bis hin zum Servi...Michael Hofmann
 
Security Scanner Design am Beispiel von httprecon
Security Scanner Design am Beispiel von httpreconSecurity Scanner Design am Beispiel von httprecon
Security Scanner Design am Beispiel von httpreconMarc Ruef
 
Splunk und das Triage Tool THOR
Splunk und das Triage Tool THORSplunk und das Triage Tool THOR
Splunk und das Triage Tool THORGeorg Knon
 
Compliance und Governance in der DevOps-Acht
Compliance und Governance in der DevOps-AchtCompliance und Governance in der DevOps-Acht
Compliance und Governance in der DevOps-AchtBATbern
 
Microservices – die Architektur für Agile-Entwicklung?
Microservices – die Architektur für Agile-Entwicklung?Microservices – die Architektur für Agile-Entwicklung?
Microservices – die Architektur für Agile-Entwicklung?Christian Baranowski
 
OSMC 2013 | Enterprise Platforms Monitoring at s IT Solutions AT by Johannes ...
OSMC 2013 | Enterprise Platforms Monitoring at s IT Solutions AT by Johannes ...OSMC 2013 | Enterprise Platforms Monitoring at s IT Solutions AT by Johannes ...
OSMC 2013 | Enterprise Platforms Monitoring at s IT Solutions AT by Johannes ...NETWAYS
 
5 lukas ruf hacking in the cloud
5 lukas ruf  hacking in the cloud5 lukas ruf  hacking in the cloud
5 lukas ruf hacking in the cloudDigicomp Academy AG
 
IKT-Trends und deren Bedeutung für eHealth
IKT-Trends und deren Bedeutung für eHealthIKT-Trends und deren Bedeutung für eHealth
IKT-Trends und deren Bedeutung für eHealthFraunhofer AISEC
 
Observability: Der Schlüssel für Threat Detection, Mitigation und Analyse
Observability: Der Schlüssel für Threat Detection, Mitigation und Analyse Observability: Der Schlüssel für Threat Detection, Mitigation und Analyse
Observability: Der Schlüssel für Threat Detection, Mitigation und Analyse QAware GmbH
 
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“OPEN KNOWLEDGE GmbH
 
Dataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesDataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesQAware GmbH
 
Living on the Edge - Microservices in der Wildnis
Living on the Edge - Microservices in der WildnisLiving on the Edge - Microservices in der Wildnis
Living on the Edge - Microservices in der Wildnismmeisenzahl
 
Magento auf der Kommandozeile: n98-magerun, ein netz98 Tool
Magento auf der Kommandozeile: n98-magerun, ein netz98 ToolMagento auf der Kommandozeile: n98-magerun, ein netz98 Tool
Magento auf der Kommandozeile: n98-magerun, ein netz98 ToolChristian Münch
 

Ähnlich wie Nagios Conference 2006 | Nagios - Fallstudie bei der MAN IT Services GmbH by Tobias Mucke (20)

Steinzeit war gestern! Wege der Cloud-nativen Evolution.
Steinzeit war gestern! Wege der Cloud-nativen Evolution.Steinzeit war gestern! Wege der Cloud-nativen Evolution.
Steinzeit war gestern! Wege der Cloud-nativen Evolution.
 
DevOps in der Praxis
DevOps in der PraxisDevOps in der Praxis
DevOps in der Praxis
 
Servicierung von Monolithen - Der Weg zu neuen Technologien bis hin zum Servi...
Servicierung von Monolithen - Der Weg zu neuen Technologien bis hin zum Servi...Servicierung von Monolithen - Der Weg zu neuen Technologien bis hin zum Servi...
Servicierung von Monolithen - Der Weg zu neuen Technologien bis hin zum Servi...
 
Security Scanner Design am Beispiel von httprecon
Security Scanner Design am Beispiel von httpreconSecurity Scanner Design am Beispiel von httprecon
Security Scanner Design am Beispiel von httprecon
 
Splunk und das Triage Tool THOR
Splunk und das Triage Tool THORSplunk und das Triage Tool THOR
Splunk und das Triage Tool THOR
 
Wie sich SaaS und PaaS in Unternehmen durchsetzen wird
Wie sich SaaS und PaaS in Unternehmen durchsetzen wirdWie sich SaaS und PaaS in Unternehmen durchsetzen wird
Wie sich SaaS und PaaS in Unternehmen durchsetzen wird
 
Gil2013 gridsolut public
Gil2013 gridsolut publicGil2013 gridsolut public
Gil2013 gridsolut public
 
Compliance und Governance in der DevOps-Acht
Compliance und Governance in der DevOps-AchtCompliance und Governance in der DevOps-Acht
Compliance und Governance in der DevOps-Acht
 
Microservices – die Architektur für Agile-Entwicklung?
Microservices – die Architektur für Agile-Entwicklung?Microservices – die Architektur für Agile-Entwicklung?
Microservices – die Architektur für Agile-Entwicklung?
 
OSMC 2013 | Enterprise Platforms Monitoring at s IT Solutions AT by Johannes ...
OSMC 2013 | Enterprise Platforms Monitoring at s IT Solutions AT by Johannes ...OSMC 2013 | Enterprise Platforms Monitoring at s IT Solutions AT by Johannes ...
OSMC 2013 | Enterprise Platforms Monitoring at s IT Solutions AT by Johannes ...
 
5 lukas ruf hacking in the cloud
5 lukas ruf  hacking in the cloud5 lukas ruf  hacking in the cloud
5 lukas ruf hacking in the cloud
 
IKT-Trends und deren Bedeutung für eHealth
IKT-Trends und deren Bedeutung für eHealthIKT-Trends und deren Bedeutung für eHealth
IKT-Trends und deren Bedeutung für eHealth
 
Observability: Der Schlüssel für Threat Detection, Mitigation und Analyse
Observability: Der Schlüssel für Threat Detection, Mitigation und Analyse Observability: Der Schlüssel für Threat Detection, Mitigation und Analyse
Observability: Der Schlüssel für Threat Detection, Mitigation und Analyse
 
Innovation in der Instandhaltung - Motor für die Zukunft
Innovation in der Instandhaltung - Motor für die ZukunftInnovation in der Instandhaltung - Motor für die Zukunft
Innovation in der Instandhaltung - Motor für die Zukunft
 
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
 
Dataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesDataservices - Data Processing mit Microservices
Dataservices - Data Processing mit Microservices
 
Living on the Edge - Microservices in der Wildnis
Living on the Edge - Microservices in der WildnisLiving on the Edge - Microservices in der Wildnis
Living on the Edge - Microservices in der Wildnis
 
Magento auf der Kommandozeile: n98-magerun, ein netz98 Tool
Magento auf der Kommandozeile: n98-magerun, ein netz98 ToolMagento auf der Kommandozeile: n98-magerun, ein netz98 Tool
Magento auf der Kommandozeile: n98-magerun, ein netz98 Tool
 
Webinar - Vom Sensor in die Cloud – von individuell bis plug & play
Webinar - Vom Sensor in die Cloud – von individuell bis plug & playWebinar - Vom Sensor in die Cloud – von individuell bis plug & play
Webinar - Vom Sensor in die Cloud – von individuell bis plug & play
 
Devops
DevopsDevops
Devops
 

Kürzlich hochgeladen

Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...
Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...
Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...OPEN KNOWLEDGE GmbH
 
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...DNUG e.V.
 
Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...DNUG e.V.
 
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...Markus Unterauer
 
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data Imputation
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data ImputationFEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data Imputation
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data ImputationOPEN KNOWLEDGE GmbH
 
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die Cloud
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die CloudFrom Zero to still Zero: Die schönsten Fehler auf dem Weg in die Cloud
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die CloudOPEN KNOWLEDGE GmbH
 

Kürzlich hochgeladen (6)

Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...
Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...
Machine Learning? Ja gerne! Aber was und wie? Eine Kurzanleitung für den erfo...
 
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (2) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
 
Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
Slides (1) zu Teil 3 der Veranstaltungsreihe Anwendungsentwicklung mit Volt M...
 
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...
Rückwärts denken vorwärts handeln - Requirements Reverse Engineering bei Syst...
 
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data Imputation
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data ImputationFEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data Imputation
FEHLENDE DATEN? (K)EIN PROBLEM!: Die Kunst der Data Imputation
 
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die Cloud
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die CloudFrom Zero to still Zero: Die schönsten Fehler auf dem Weg in die Cloud
From Zero to still Zero: Die schönsten Fehler auf dem Weg in die Cloud
 

Nagios Conference 2006 | Nagios - Fallstudie bei der MAN IT Services GmbH by Tobias Mucke

  • 1. Fallstudie – Nagios bei MIT 21.09.2006 1Tobias MuckeMAN IT Services GmbH Fallstudie – Nagios bei MIT
  • 2. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 2Tobias Mucke Vorstellung - MAN IT Services GmbH IT Dienstleister für die MAN Gruppe Gründung als eigenständige GmbH in 2005, Betrieb ab Januar 2006 10 Standorte 320 Mitarbeiter Geschäftsfelder RZ Infrastruktur und Betrieb Entwicklung teilkonzernübergreifender Anwendungen Beratung
  • 3. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 3Tobias Mucke Vorstellung - Referent MIT Enterprise Engineering – Linux Systemadministration derzeit etwa 200 Linux basierte Systeme Projekte Standardisierung der Linux Enterprise Server Umgebung Zentrales und automatisiertes Deployment für die Systeminstallation, -konfiguration und -wartung Hochverfügbarkeit Hardware- und Systemmonitoring mit Nagios
  • 4. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 4Tobias Mucke Gliederung (1) I. Begriffsabgrenzung II. Einführung in das Spannungsverhältnis zwischen der 1. Heterogenität der Monitoring Infrastruktur vor Nagios 2. Homogenität der Linux Infrastruktur III. Projektziele und -rahmen …
  • 5. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 5Tobias Mucke Gliederung (2) IV. Nagios Monitoring Infrastruktur 1. Grundlegende Entscheidungen und Konfigurationsansätze 2. Infrastrukturüberblick 3. In Zahlen V. Plugins VI. Auswertung der Performancedaten VII. Rückblick - Ein Jahr Nagios
  • 6. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 6Tobias Mucke Begriffsabgrenzung - Monitoring Hardwaremonitoring Lüfter, Netzteile, HDDs, Memorymodule, Temperaturen usw. Systemmonitoring Dateisysteme, Prozesse, Arbeitsspeicher usw. Netzwerk- und Basisdienstemonitoring Netzwerkkomponenten, DNS, Webserver, Oracle Datenbanken Status: GRGRÜÜNN, GELBGELB oder ROTROT z.B. zur Alarmierung / Eskalation
  • 7. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 7Tobias Mucke Begriffsabgrenzung – Messung von Performancedaten Kurz-, mittel- und langfristige Aufzeichnung von Messwerten Einsatz unterschiedlicher Messmethoden (Pegelstände, Zähler, Differenzen usw. ) Einheit des Messergebnisses (Sekunden, Grad, Bytes usw.) Geeignete Verdichtung über die Zeit Messwerte: Grafische Darstellung in Diagrammen z.B. zur Trendanalyse / Planung
  • 8. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 8Tobias Mucke Monitoring Infrastruktur vor Nagios Intranet DMZ Internet Firewall Firewall Skripte Bigbrother Cacti Messwerte Cacti Messwerte Bigbrother HW Alarme HW Alarme
  • 9. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 9Tobias Mucke Homogenität der Linux Infrastruktur Hoher Standardisierungsgrad der Systeme Drei- bis vierschichtige Infrastrukturkonzepte Hoher Anteil von in Farmen (60%) / Clustern (20%) organisierter Systeme Starke Homogenität der Systeme, kaum (< 10%) Einzelsysteme
  • 10. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 10Tobias Mucke Spannungsverhältnis Heterogenität der Monitoring Infrastruktur vs. Homogentität der Linux Infrastruktur Neukonzeptionierung der Monitoring Infrastruktur
  • 11. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 11Tobias Mucke Primäre Projektziele 1. Konsolidierung 2. Zentralisierung 3. Verfügbarkeit 4. Kostensenkung
  • 12. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 12Tobias Mucke Sekundäre Projektziele 1. Skalierbarkeit 2. Integration 3. Flexibilisierung 4. Paradigmenwechsel 5. Standardisierung
  • 13. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 13Tobias Mucke Projektrahmen Zeit Implementierung der Basisinfrastruktur durch Michael Frank im Rahmen des ersten Praxissemester FH Augsburg (20 Wochen) Budget Nutzung bereits vorhandener Ressourcen, kein eigenes Budget
  • 14. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 14Tobias Mucke Entscheidungsfindung Nagios Szenarien Zentrales Network Monitoring System Distributed Monitoring Server HA Network Monitoring Skalierbarkeit Konsolidierung und Integration Flexibilität Weiche Faktoren
  • 15. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 15Tobias Mucke Nagios Infrastruktur Intranet DMZ Internet Firewall Firewall Messwerte NMS Messwerte Mailserver / Ticketsystem NRPE NRPE SSH NSCA Config Deploy
  • 16. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 16Tobias Mucke In Zahlen HA NMS mit jeweils 2 CPUs à 3.00 GHz und 2 GB Memory 3x DMS mit jeweils 2 CPUs à 3.00 GHz und 2 GB Memory Etwa 200 Systeme Knapp 5500 Checks Knapp 5300 RRD Datenbanken
  • 17. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 17Tobias Mucke Plugins - Überblick Standardplugins aus dem Nagios Plugin Development Projekt Ergänzende Plugins von Nagios Exchange Einige selbst geschriebene Plugins
  • 18. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 18Tobias Mucke Plugins - Hardwaremonitoring Herstellerspezifische Agenten SNMP Traps an SNMPTRAPD SNMPTRAPD übergibt Traps an SNMP Trap Translator Weitermeldung an NMS durch passiven Check
  • 19. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 19Tobias Mucke Plugins - Systemmonitoring (1) Monitoring für MD und DRBD check_md check_drbd Statistiken interner Kernelcaches (Slabinfo) check_slabstat
  • 20. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 20Tobias Mucke Plugins - Systemmonitoring (2) Monitoring der NRPE daemons check_nrpe Monitoring der Systemzeit check_ntp DNS Einträge in der Vorwärts- und Rückwärtsauflösung check_dns
  • 21. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 21Tobias Mucke Plugins - Nagios Monitoring des Nagios Systems: check_nagios Statistiken: check_nagios_stats
  • 22. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 22Tobias Mucke Plugins - Sonstiges RPC und NFS Statistiken (Server / Client) check_rpcstat check_nfsstat Monitoring HTTP Server und SSL Zertifikate check_http
  • 23. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 23Tobias Mucke Performancedaten mit RRD Auswertung der Plugin Performancedaten Kurz-, Mittel- und Langfristig Nutzung des bestehenden RRDTool Know Hows Umgehung des Flaschenhals beim Weitergeben der Performancedaten Maximale Flexibilität beim Erstellen und Anzeigen der Daten
  • 24. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 24Tobias Mucke Sammlung und Auswertung der Performancedaten Übergabe der Performancedaten durch Nagios mittels einer Datei Regelmäßiger Aufruf von Nagiosgraph Nagiosgraph zur Erstellung und Pflege der RRDs Nagiostat und Drraw zur Anzeige / Dashboards
  • 25. Fallstudie – Nagios bei MIT 21.09.2006MAN IT Services GmbH 25Tobias Mucke Rückblick nach einem Jahr Nagios Einteilung der Zeitrechnung in eine Zeit vor und nach Nagios Projektziele Konsolidierung und Zentralisierung Skalierbarkeit und Verfügbarkeit Integration Kostensenkung Standardisierung