SlideShare ist ein Scribd-Unternehmen logo
1 von 14
Downloaden Sie, um offline zu lesen
1
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
2
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
REDUNDANTER LINUX FAILOVER CLUSTER
… WIE KANN ICH MEINE VERFÜGBARKEIT UND MEINE UPTIME ERHÖHEN?
https://xkcd.com/705/
3
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
THEMEN
1. MOTIVATION / AUSGANGSLAGE
2. SPIELRAUM UND ANFORDERUNGEN
AN MMFC VER. 2
3. NETZWERK
4. LINUX IMPLEMENTATION MMFC
5. DEMO
4
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
MOTIVATION / AUSGANGSLAGE
VORHANDENE SITUATION
• Bisherige bestehende Failover Systeme sind in einem Datacenter
• Vorteile:
• KISS: Keep it simple [and] stupid
• Ausfallsicherheit mit Redundanz gegenüber Hardware Fehler (Server, Netzwerk,
Power)
• Redundanz im Netzwerk-Design (alles ist redundante aufgebaut und
eingestöpselt)
• Failover ist schnell
• Schwächen:
• Connectivity - Bei einem «fettem» Netzwerk-Verkehr wie DDoS auf einen
beliebigen Host im gleichen Rack oder auch Datacenter sind auch andere
Serversysteme und so auch die Failover Systeme betroffen
5
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
SPIELRAUM FÜR MMFC 2.0
MANAGED MULTISITE FAILOVER CLUSTER
Wünsche an ein neuen Multisite Failover Cluster System:
• Betrieb ist standortunabhängig (räumlich und entfernt örtlich) georedundant ✔
• Betrieb hat mehr als einen Stromlieferanten und USVs Strom 2x ✔
• Gespiegeltes Server und Cluster System HW 2x ✔
• Redundanz im Netzwerk (Core, Distribution, Upstream) Netzwerk ✔
• Dedizierter Quorum Server für Königsmacher an einem dritten Standort Quorum ✔
• Gleichbleibende IPs unabhängig vom aktiven Standort (Multisite Virtual IPs) IPv4 ✔
6
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
SPIELRAUM FÜR MMFC 2.0
MANAGED MULTISITE FAILOVER CLUSTER
Linux Server – Netzwerk Wünsche zur Konnektivität:
• Netzwerk zum Server wird per LACP gebündelt Switchausfall ✔
• Announcing der Route per BGP an beide Distribution RouterDistribution Router Ausfall ✔
• Unabhängige Core Router Router Ausfall ✔
• Multi Upstream ProviderUpstream Ausfall ✔
Datacenterausfall:
• Switching muss dann sehr schnell gehen, aber im Normal- BGP mit BFD ✔
Fall wollen wir vom Routing her träge sein
• Inhalte sollen dann schnell ausgeliefert werden Caching ✔ ggf. mit Vorglühen
Bestehende Resourcen nutzend
• Lastspitzen werden optimal mit der bestehenden Infra- Load Balancer ✔
struktur abgedeckt
7
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
NETZWERK
VORHANDENE SITUATION NINE.CH BACKBONE
• Layer3 only Backbone
• Segmentierte IP Bereiche
• OSPF zwischen Core Routern und Core zu Distribution Layer
• BGP nur auf Core Layer
• Brocade VCS Fabrics pro Segment Distribution/Access
• Redundanz
Schwächen:
• Keine aktive Kommunikation mit einem Server wie sein „Status“ ist
• IP Adresse „kann“ nur an „einem“ Ort im Netz vorhanden sein
8
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
NETZWERK
PROBLEM ZUR LÖSUNG?
• Protokolle
OSPF, IS-IS, Static, RIP(v2), BGP
• Failover
Ausfall Server
Ausfall Router
Auf Befehl
• Speed
Protokoll träge und langsam
• Sicherheit
Wer darf was senden?
9
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
NETZWERK
LÖSUNG NETZWERK SICHT
• Distribution Layer spricht BGP mit Server
• Communities
• Aktive Sessions mit oder ohne Prefix
• Prefix Filter
• Redistributing in OSPF
• Segmente sprechen iBGP untereinander
• BFD in Richtung Server aktiv
• Kein iBGP zwischen Distribution und Core
• Failover nach ca. 500ms
• BGP Sessions zu beiden Routern pro Segment
• Aktive BGP Sessions an beiden Standorten mit aktiven Prefixes
10
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
LINUX IMPLEMENTATION
BGP HANDLING AUF DEM SERVER
BIRD Internet Routing Daemon (http://bird.network.cz)
für die eBGP Kommunikation zwischen den Servern und Netzwerk Endpunkten
• Always – on: 2 x 2 BGP Sessions hin zu 2 Routern
• IPs können zwischen den beiden Hosts und DCs innerhalb von 2 Sekunden effektiv
migriert werden
• BFD Fail Action ist schneller
• Die Linux Routing Table gibt dynamisch bekannt, welche IP auf dem Host aktiv ist …
• … und so auch per BGP exportiert wird.
11
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
LINUX IMPLEMENTATION
SAVE STATE HANDLING
3 Node Clusters mit Quorum
• Was passiert, wenn ein Multisite Failover Cluster Node und der Quorum Node ausfallen?
• Multisite DRP
12
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
DEMO
SERVICE MIGRATION
13
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
Nine Internet Solutions AG
Albisriederstr. 243a
CH-8047 Zürich
Tel +41 44 637 40 00
Fax +41 44 637 40 01
info@nine.ch
FRAGEN?
14
TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0
Version 1.0
#TechTalkThursday
Nine Internet Solutions AG
Albisriederstr. 243a
CH-8047 Zürich
Tel +41 44 637 40 00
Fax +41 44 637 40 01
info@nine.ch
DANKE FÜR DIE
AUFMERKSAMKEIT!

Weitere ähnliche Inhalte

Was ist angesagt? (6)

WeOS 4.30.0
WeOS 4.30.0WeOS 4.30.0
WeOS 4.30.0
 
We os 4.31.0 und weconfig 1.14.0
We os 4.31.0 und weconfig 1.14.0We os 4.31.0 und weconfig 1.14.0
We os 4.31.0 und weconfig 1.14.0
 
LMD - Livestatus Multitool Daemon
LMD - Livestatus Multitool DaemonLMD - Livestatus Multitool Daemon
LMD - Livestatus Multitool Daemon
 
Vitorsworkshop
VitorsworkshopVitorsworkshop
Vitorsworkshop
 
Port Security - Industrieller Cyber Security
Port Security - Industrieller Cyber SecurityPort Security - Industrieller Cyber Security
Port Security - Industrieller Cyber Security
 
WeOS 4.29.0 & WeConfig 1.13.1
WeOS 4.29.0 & WeConfig 1.13.1WeOS 4.29.0 & WeConfig 1.13.1
WeOS 4.29.0 & WeConfig 1.13.1
 

Ähnlich wie TechTalkThursday 27.10.2016: Redundante Linux Failover Cluster

Software Defined Freifunk Backbones
Software Defined Freifunk BackbonesSoftware Defined Freifunk Backbones
Software Defined Freifunk BackbonesMaximilan Wilhelm
 
Pub/Sub for the masses- Ein Einführungsworkshop in MQTT [GERMAN]
Pub/Sub for the masses- Ein Einführungsworkshop in MQTT [GERMAN]Pub/Sub for the masses- Ein Einführungsworkshop in MQTT [GERMAN]
Pub/Sub for the masses- Ein Einführungsworkshop in MQTT [GERMAN]Dominik Obermaier
 
Infracoders Graz, smartOS - vom Netzwerk in der Box - zum Software Cloud Stack
Infracoders Graz, smartOS - vom Netzwerk in der Box - zum Software Cloud StackInfracoders Graz, smartOS - vom Netzwerk in der Box - zum Software Cloud Stack
Infracoders Graz, smartOS - vom Netzwerk in der Box - zum Software Cloud StackEdmund Siegfried Haselwanter
 
TechTalkThursday 26.11.2015: Zentrales Metriken-System - ist der Flügelschlag...
TechTalkThursday 26.11.2015: Zentrales Metriken-System - ist der Flügelschlag...TechTalkThursday 26.11.2015: Zentrales Metriken-System - ist der Flügelschlag...
TechTalkThursday 26.11.2015: Zentrales Metriken-System - ist der Flügelschlag...nine
 
Ausfallsichere Kultur mit Plone
Ausfallsichere Kultur mit PloneAusfallsichere Kultur mit Plone
Ausfallsichere Kultur mit PloneJens Klein
 
2. IPv6 Neighbor Discovery und Autokonfiguration - Marc Eggenberger
2. IPv6 Neighbor Discovery und Autokonfiguration - Marc Eggenberger2. IPv6 Neighbor Discovery und Autokonfiguration - Marc Eggenberger
2. IPv6 Neighbor Discovery und Autokonfiguration - Marc EggenbergerDigicomp Academy AG
 
Private Cloud mit Ceph und OpenStack
Private Cloud mit Ceph und OpenStackPrivate Cloud mit Ceph und OpenStack
Private Cloud mit Ceph und OpenStackDaniel Schneller
 
Ltsp5 In Einer Stunde Zum Terminalserver
Ltsp5   In Einer Stunde Zum TerminalserverLtsp5   In Einer Stunde Zum Terminalserver
Ltsp5 In Einer Stunde Zum TerminalserverDuns Scotus
 
Froxlor
FroxlorFroxlor
FroxlorDerChb
 
Grundlagen der IP Kommunikation
Grundlagen der IP KommunikationGrundlagen der IP Kommunikation
Grundlagen der IP KommunikationKay Schönewerk
 
Making the internet faster HTTP/3 und QUIC
Making the internet faster HTTP/3 und QUICMaking the internet faster HTTP/3 und QUIC
Making the internet faster HTTP/3 und QUICQAware GmbH
 
Nagios Conference 2007 | Vmware Monitoring by Ingo Latschner
Nagios Conference 2007 | Vmware Monitoring by Ingo LatschnerNagios Conference 2007 | Vmware Monitoring by Ingo Latschner
Nagios Conference 2007 | Vmware Monitoring by Ingo LatschnerNETWAYS
 
Switches: Durchgängige Vernetzung bis ins Feld
Switches: Durchgängige Vernetzung bis ins FeldSwitches: Durchgängige Vernetzung bis ins Feld
Switches: Durchgängige Vernetzung bis ins FeldMacKenzie Regorsek
 
Continuous Delivery für Cloud-native Anwendungen auf Cloud-nativer Infrastruktur
Continuous Delivery für Cloud-native Anwendungen auf Cloud-nativer InfrastrukturContinuous Delivery für Cloud-native Anwendungen auf Cloud-nativer Infrastruktur
Continuous Delivery für Cloud-native Anwendungen auf Cloud-nativer InfrastrukturQAware GmbH
 
Domino Security Present and Future ConnectED Review - ICS.UG 2016
Domino Security Present and Future ConnectED Review - ICS.UG 2016Domino Security Present and Future ConnectED Review - ICS.UG 2016
Domino Security Present and Future ConnectED Review - ICS.UG 2016ICS User Group
 
Trapeze WLAN-Lösung
Trapeze WLAN-LösungTrapeze WLAN-Lösung
Trapeze WLAN-Lösungnetlogix
 

Ähnlich wie TechTalkThursday 27.10.2016: Redundante Linux Failover Cluster (20)

Software Defined Freifunk Backbones
Software Defined Freifunk BackbonesSoftware Defined Freifunk Backbones
Software Defined Freifunk Backbones
 
Westermo Webinar - Geroutete Redundanzen
Westermo Webinar - Geroutete RedundanzenWestermo Webinar - Geroutete Redundanzen
Westermo Webinar - Geroutete Redundanzen
 
Pub/Sub for the masses- Ein Einführungsworkshop in MQTT [GERMAN]
Pub/Sub for the masses- Ein Einführungsworkshop in MQTT [GERMAN]Pub/Sub for the masses- Ein Einführungsworkshop in MQTT [GERMAN]
Pub/Sub for the masses- Ein Einführungsworkshop in MQTT [GERMAN]
 
Infracoders Graz, smartOS - vom Netzwerk in der Box - zum Software Cloud Stack
Infracoders Graz, smartOS - vom Netzwerk in der Box - zum Software Cloud StackInfracoders Graz, smartOS - vom Netzwerk in der Box - zum Software Cloud Stack
Infracoders Graz, smartOS - vom Netzwerk in der Box - zum Software Cloud Stack
 
TechTalkThursday 26.11.2015: Zentrales Metriken-System - ist der Flügelschlag...
TechTalkThursday 26.11.2015: Zentrales Metriken-System - ist der Flügelschlag...TechTalkThursday 26.11.2015: Zentrales Metriken-System - ist der Flügelschlag...
TechTalkThursday 26.11.2015: Zentrales Metriken-System - ist der Flügelschlag...
 
Neuigkeiten von Westermos MRD Mobilfunkroutern
Neuigkeiten von Westermos MRD MobilfunkrouternNeuigkeiten von Westermos MRD Mobilfunkroutern
Neuigkeiten von Westermos MRD Mobilfunkroutern
 
Ausfallsichere Kultur mit Plone
Ausfallsichere Kultur mit PloneAusfallsichere Kultur mit Plone
Ausfallsichere Kultur mit Plone
 
2. IPv6 Neighbor Discovery und Autokonfiguration - Marc Eggenberger
2. IPv6 Neighbor Discovery und Autokonfiguration - Marc Eggenberger2. IPv6 Neighbor Discovery und Autokonfiguration - Marc Eggenberger
2. IPv6 Neighbor Discovery und Autokonfiguration - Marc Eggenberger
 
Private Cloud mit Ceph und OpenStack
Private Cloud mit Ceph und OpenStackPrivate Cloud mit Ceph und OpenStack
Private Cloud mit Ceph und OpenStack
 
Layer 2 Redundanzen
Layer 2 RedundanzenLayer 2 Redundanzen
Layer 2 Redundanzen
 
Ltsp5 In Einer Stunde Zum Terminalserver
Ltsp5   In Einer Stunde Zum TerminalserverLtsp5   In Einer Stunde Zum Terminalserver
Ltsp5 In Einer Stunde Zum Terminalserver
 
Froxlor
FroxlorFroxlor
Froxlor
 
Webinar - WeOS 4.33.0 und WeConfig 1.19.0.pdf
Webinar - WeOS 4.33.0 und WeConfig 1.19.0.pdfWebinar - WeOS 4.33.0 und WeConfig 1.19.0.pdf
Webinar - WeOS 4.33.0 und WeConfig 1.19.0.pdf
 
Grundlagen der IP Kommunikation
Grundlagen der IP KommunikationGrundlagen der IP Kommunikation
Grundlagen der IP Kommunikation
 
Making the internet faster HTTP/3 und QUIC
Making the internet faster HTTP/3 und QUICMaking the internet faster HTTP/3 und QUIC
Making the internet faster HTTP/3 und QUIC
 
Nagios Conference 2007 | Vmware Monitoring by Ingo Latschner
Nagios Conference 2007 | Vmware Monitoring by Ingo LatschnerNagios Conference 2007 | Vmware Monitoring by Ingo Latschner
Nagios Conference 2007 | Vmware Monitoring by Ingo Latschner
 
Switches: Durchgängige Vernetzung bis ins Feld
Switches: Durchgängige Vernetzung bis ins FeldSwitches: Durchgängige Vernetzung bis ins Feld
Switches: Durchgängige Vernetzung bis ins Feld
 
Continuous Delivery für Cloud-native Anwendungen auf Cloud-nativer Infrastruktur
Continuous Delivery für Cloud-native Anwendungen auf Cloud-nativer InfrastrukturContinuous Delivery für Cloud-native Anwendungen auf Cloud-nativer Infrastruktur
Continuous Delivery für Cloud-native Anwendungen auf Cloud-nativer Infrastruktur
 
Domino Security Present and Future ConnectED Review - ICS.UG 2016
Domino Security Present and Future ConnectED Review - ICS.UG 2016Domino Security Present and Future ConnectED Review - ICS.UG 2016
Domino Security Present and Future ConnectED Review - ICS.UG 2016
 
Trapeze WLAN-Lösung
Trapeze WLAN-LösungTrapeze WLAN-Lösung
Trapeze WLAN-Lösung
 

Mehr von nine

Challenges behind the scenes of the large Swiss e-Commerce shop apfelkiste.ch...
Challenges behind the scenes of the large Swiss e-Commerce shop apfelkiste.ch...Challenges behind the scenes of the large Swiss e-Commerce shop apfelkiste.ch...
Challenges behind the scenes of the large Swiss e-Commerce shop apfelkiste.ch...nine
 
Delivering real-time video globally at Internet scale - Stefan Birrer, Co-Fou...
Delivering real-time video globally at Internet scale - Stefan Birrer, Co-Fou...Delivering real-time video globally at Internet scale - Stefan Birrer, Co-Fou...
Delivering real-time video globally at Internet scale - Stefan Birrer, Co-Fou...nine
 
How a titan empowers our cloud monitoring infrastructure
How a titan empowers our cloud monitoring infrastructureHow a titan empowers our cloud monitoring infrastructure
How a titan empowers our cloud monitoring infrastructurenine
 
GitOps and security by Reto Bollinger, CSIO nine.ch
GitOps and security by Reto Bollinger, CSIO nine.chGitOps and security by Reto Bollinger, CSIO nine.ch
GitOps and security by Reto Bollinger, CSIO nine.chnine
 
GCP Meetup #3 - Approaches to Cloud Native Architectures
GCP Meetup #3 - Approaches to Cloud Native ArchitecturesGCP Meetup #3 - Approaches to Cloud Native Architectures
GCP Meetup #3 - Approaches to Cloud Native Architecturesnine
 
Security In The Public Cloud
Security In The Public CloudSecurity In The Public Cloud
Security In The Public Cloudnine
 
TechTalkThursday: Microservices
TechTalkThursday: MicroservicesTechTalkThursday: Microservices
TechTalkThursday: Microservicesnine
 
Automating OpenShift Deployments
Automating OpenShift DeploymentsAutomating OpenShift Deployments
Automating OpenShift Deploymentsnine
 
Docker for Developers
Docker for DevelopersDocker for Developers
Docker for Developersnine
 
Das Web im Geschwindigkeitsrausch
Das Web im GeschwindigkeitsrauschDas Web im Geschwindigkeitsrausch
Das Web im Geschwindigkeitsrauschnine
 
TechTalkThursday 29.06.2017: Wie verhält sich DDoS in der Realität?
TechTalkThursday 29.06.2017: Wie verhält sich DDoS in der Realität?TechTalkThursday 29.06.2017: Wie verhält sich DDoS in der Realität?
TechTalkThursday 29.06.2017: Wie verhält sich DDoS in der Realität?nine
 
TechTalkThursday 02.03.2017: Container-Orchestrierung mit OpenShift - Unser W...
TechTalkThursday 02.03.2017: Container-Orchestrierung mit OpenShift - Unser W...TechTalkThursday 02.03.2017: Container-Orchestrierung mit OpenShift - Unser W...
TechTalkThursday 02.03.2017: Container-Orchestrierung mit OpenShift - Unser W...nine
 
TechTalkThursday 27.10.2016: Ceph im NVME Cluster
TechTalkThursday 27.10.2016: Ceph im NVME ClusterTechTalkThursday 27.10.2016: Ceph im NVME Cluster
TechTalkThursday 27.10.2016: Ceph im NVME Clusternine
 
TechTalkThursday 27.10.2016: upd89.org - Orchestrierung von Security-Updates ...
TechTalkThursday 27.10.2016: upd89.org - Orchestrierung von Security-Updates ...TechTalkThursday 27.10.2016: upd89.org - Orchestrierung von Security-Updates ...
TechTalkThursday 27.10.2016: upd89.org - Orchestrierung von Security-Updates ...nine
 
TechTalkThursday 14.04.2016: Load tests of web applications as a service
TechTalkThursday 14.04.2016: Load tests of web applications as a serviceTechTalkThursday 14.04.2016: Load tests of web applications as a service
TechTalkThursday 14.04.2016: Load tests of web applications as a servicenine
 
TechTalkThursday 14.04.2016: Service Oriented Architecture @nine.ch
TechTalkThursday 14.04.2016: Service Oriented Architecture @nine.chTechTalkThursday 14.04.2016: Service Oriented Architecture @nine.ch
TechTalkThursday 14.04.2016: Service Oriented Architecture @nine.chnine
 

Mehr von nine (16)

Challenges behind the scenes of the large Swiss e-Commerce shop apfelkiste.ch...
Challenges behind the scenes of the large Swiss e-Commerce shop apfelkiste.ch...Challenges behind the scenes of the large Swiss e-Commerce shop apfelkiste.ch...
Challenges behind the scenes of the large Swiss e-Commerce shop apfelkiste.ch...
 
Delivering real-time video globally at Internet scale - Stefan Birrer, Co-Fou...
Delivering real-time video globally at Internet scale - Stefan Birrer, Co-Fou...Delivering real-time video globally at Internet scale - Stefan Birrer, Co-Fou...
Delivering real-time video globally at Internet scale - Stefan Birrer, Co-Fou...
 
How a titan empowers our cloud monitoring infrastructure
How a titan empowers our cloud monitoring infrastructureHow a titan empowers our cloud monitoring infrastructure
How a titan empowers our cloud monitoring infrastructure
 
GitOps and security by Reto Bollinger, CSIO nine.ch
GitOps and security by Reto Bollinger, CSIO nine.chGitOps and security by Reto Bollinger, CSIO nine.ch
GitOps and security by Reto Bollinger, CSIO nine.ch
 
GCP Meetup #3 - Approaches to Cloud Native Architectures
GCP Meetup #3 - Approaches to Cloud Native ArchitecturesGCP Meetup #3 - Approaches to Cloud Native Architectures
GCP Meetup #3 - Approaches to Cloud Native Architectures
 
Security In The Public Cloud
Security In The Public CloudSecurity In The Public Cloud
Security In The Public Cloud
 
TechTalkThursday: Microservices
TechTalkThursday: MicroservicesTechTalkThursday: Microservices
TechTalkThursday: Microservices
 
Automating OpenShift Deployments
Automating OpenShift DeploymentsAutomating OpenShift Deployments
Automating OpenShift Deployments
 
Docker for Developers
Docker for DevelopersDocker for Developers
Docker for Developers
 
Das Web im Geschwindigkeitsrausch
Das Web im GeschwindigkeitsrauschDas Web im Geschwindigkeitsrausch
Das Web im Geschwindigkeitsrausch
 
TechTalkThursday 29.06.2017: Wie verhält sich DDoS in der Realität?
TechTalkThursday 29.06.2017: Wie verhält sich DDoS in der Realität?TechTalkThursday 29.06.2017: Wie verhält sich DDoS in der Realität?
TechTalkThursday 29.06.2017: Wie verhält sich DDoS in der Realität?
 
TechTalkThursday 02.03.2017: Container-Orchestrierung mit OpenShift - Unser W...
TechTalkThursday 02.03.2017: Container-Orchestrierung mit OpenShift - Unser W...TechTalkThursday 02.03.2017: Container-Orchestrierung mit OpenShift - Unser W...
TechTalkThursday 02.03.2017: Container-Orchestrierung mit OpenShift - Unser W...
 
TechTalkThursday 27.10.2016: Ceph im NVME Cluster
TechTalkThursday 27.10.2016: Ceph im NVME ClusterTechTalkThursday 27.10.2016: Ceph im NVME Cluster
TechTalkThursday 27.10.2016: Ceph im NVME Cluster
 
TechTalkThursday 27.10.2016: upd89.org - Orchestrierung von Security-Updates ...
TechTalkThursday 27.10.2016: upd89.org - Orchestrierung von Security-Updates ...TechTalkThursday 27.10.2016: upd89.org - Orchestrierung von Security-Updates ...
TechTalkThursday 27.10.2016: upd89.org - Orchestrierung von Security-Updates ...
 
TechTalkThursday 14.04.2016: Load tests of web applications as a service
TechTalkThursday 14.04.2016: Load tests of web applications as a serviceTechTalkThursday 14.04.2016: Load tests of web applications as a service
TechTalkThursday 14.04.2016: Load tests of web applications as a service
 
TechTalkThursday 14.04.2016: Service Oriented Architecture @nine.ch
TechTalkThursday 14.04.2016: Service Oriented Architecture @nine.chTechTalkThursday 14.04.2016: Service Oriented Architecture @nine.ch
TechTalkThursday 14.04.2016: Service Oriented Architecture @nine.ch
 

TechTalkThursday 27.10.2016: Redundante Linux Failover Cluster

  • 1. 1 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday
  • 2. 2 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday REDUNDANTER LINUX FAILOVER CLUSTER … WIE KANN ICH MEINE VERFÜGBARKEIT UND MEINE UPTIME ERHÖHEN? https://xkcd.com/705/
  • 3. 3 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday THEMEN 1. MOTIVATION / AUSGANGSLAGE 2. SPIELRAUM UND ANFORDERUNGEN AN MMFC VER. 2 3. NETZWERK 4. LINUX IMPLEMENTATION MMFC 5. DEMO
  • 4. 4 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday MOTIVATION / AUSGANGSLAGE VORHANDENE SITUATION • Bisherige bestehende Failover Systeme sind in einem Datacenter • Vorteile: • KISS: Keep it simple [and] stupid • Ausfallsicherheit mit Redundanz gegenüber Hardware Fehler (Server, Netzwerk, Power) • Redundanz im Netzwerk-Design (alles ist redundante aufgebaut und eingestöpselt) • Failover ist schnell • Schwächen: • Connectivity - Bei einem «fettem» Netzwerk-Verkehr wie DDoS auf einen beliebigen Host im gleichen Rack oder auch Datacenter sind auch andere Serversysteme und so auch die Failover Systeme betroffen
  • 5. 5 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday SPIELRAUM FÜR MMFC 2.0 MANAGED MULTISITE FAILOVER CLUSTER Wünsche an ein neuen Multisite Failover Cluster System: • Betrieb ist standortunabhängig (räumlich und entfernt örtlich) georedundant ✔ • Betrieb hat mehr als einen Stromlieferanten und USVs Strom 2x ✔ • Gespiegeltes Server und Cluster System HW 2x ✔ • Redundanz im Netzwerk (Core, Distribution, Upstream) Netzwerk ✔ • Dedizierter Quorum Server für Königsmacher an einem dritten Standort Quorum ✔ • Gleichbleibende IPs unabhängig vom aktiven Standort (Multisite Virtual IPs) IPv4 ✔
  • 6. 6 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday SPIELRAUM FÜR MMFC 2.0 MANAGED MULTISITE FAILOVER CLUSTER Linux Server – Netzwerk Wünsche zur Konnektivität: • Netzwerk zum Server wird per LACP gebündelt Switchausfall ✔ • Announcing der Route per BGP an beide Distribution RouterDistribution Router Ausfall ✔ • Unabhängige Core Router Router Ausfall ✔ • Multi Upstream ProviderUpstream Ausfall ✔ Datacenterausfall: • Switching muss dann sehr schnell gehen, aber im Normal- BGP mit BFD ✔ Fall wollen wir vom Routing her träge sein • Inhalte sollen dann schnell ausgeliefert werden Caching ✔ ggf. mit Vorglühen Bestehende Resourcen nutzend • Lastspitzen werden optimal mit der bestehenden Infra- Load Balancer ✔ struktur abgedeckt
  • 7. 7 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday NETZWERK VORHANDENE SITUATION NINE.CH BACKBONE • Layer3 only Backbone • Segmentierte IP Bereiche • OSPF zwischen Core Routern und Core zu Distribution Layer • BGP nur auf Core Layer • Brocade VCS Fabrics pro Segment Distribution/Access • Redundanz Schwächen: • Keine aktive Kommunikation mit einem Server wie sein „Status“ ist • IP Adresse „kann“ nur an „einem“ Ort im Netz vorhanden sein
  • 8. 8 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday NETZWERK PROBLEM ZUR LÖSUNG? • Protokolle OSPF, IS-IS, Static, RIP(v2), BGP • Failover Ausfall Server Ausfall Router Auf Befehl • Speed Protokoll träge und langsam • Sicherheit Wer darf was senden?
  • 9. 9 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday NETZWERK LÖSUNG NETZWERK SICHT • Distribution Layer spricht BGP mit Server • Communities • Aktive Sessions mit oder ohne Prefix • Prefix Filter • Redistributing in OSPF • Segmente sprechen iBGP untereinander • BFD in Richtung Server aktiv • Kein iBGP zwischen Distribution und Core • Failover nach ca. 500ms • BGP Sessions zu beiden Routern pro Segment • Aktive BGP Sessions an beiden Standorten mit aktiven Prefixes
  • 10. 10 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday LINUX IMPLEMENTATION BGP HANDLING AUF DEM SERVER BIRD Internet Routing Daemon (http://bird.network.cz) für die eBGP Kommunikation zwischen den Servern und Netzwerk Endpunkten • Always – on: 2 x 2 BGP Sessions hin zu 2 Routern • IPs können zwischen den beiden Hosts und DCs innerhalb von 2 Sekunden effektiv migriert werden • BFD Fail Action ist schneller • Die Linux Routing Table gibt dynamisch bekannt, welche IP auf dem Host aktiv ist … • … und so auch per BGP exportiert wird.
  • 11. 11 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday LINUX IMPLEMENTATION SAVE STATE HANDLING 3 Node Clusters mit Quorum • Was passiert, wenn ein Multisite Failover Cluster Node und der Quorum Node ausfallen? • Multisite DRP
  • 12. 12 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday DEMO SERVICE MIGRATION
  • 13. 13 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday Nine Internet Solutions AG Albisriederstr. 243a CH-8047 Zürich Tel +41 44 637 40 00 Fax +41 44 637 40 01 info@nine.ch FRAGEN?
  • 14. 14 TECHTALKTHURSDAY MULTISITE FAILOVER CLUSTER / ÖFFENTLICH ROMAN PLESSL Version 1.0 Version 1.0 #TechTalkThursday Nine Internet Solutions AG Albisriederstr. 243a CH-8047 Zürich Tel +41 44 637 40 00 Fax +41 44 637 40 01 info@nine.ch DANKE FÜR DIE AUFMERKSAMKEIT!