Weitere ähnliche Inhalte
Ähnlich wie Data Domain Backup & Recovery (20)
Data Domain Backup & Recovery
- 1. EMC Backup & Recovery
Solutions:
Backup to the Future
Lucian Gavris Kurt Kraus
Account Manager Advisory Technology Consultant
EMC Backup Recovery Solution Divison EMC Backup Recovery Solution Divison
lucian.gavris@datadomain.com kraus_kurt@emc.com
+49 171 499 7171
© Copyright 2009 EMC Corporation. All rights reserved. 1
- 2. Backup entwickelt sich fort
Backup/Recovery Anwendungs- Backup- und Backup- Disaster
Architektur Backup- Medien- Speicher Recovery
Klienten Verwaltung vor Ort Storage
NetWorker Band Band
Konventionell
(bandbasiert) Disk
NetWorker VTL/Band
Library
NetWorker Data Domain
Neuartig
(plattenbasiert)
Avamar
VM
Data Protection Advisor
Vor Ort Ausgelagert
© Copyright 2009 EMC Corporation. All rights reserved. 2
- 3. Warum nutzen Großunternehmen immer noch
Bänder?
Primär- • Niedrige
speicher Anschaffungskosten
PLATTE • Bänder können die massive
Menge an redundanten
BAND Daten aus Backups
speichern
• Auslagerung an zweiten
Backup Standort
Speicher
5-10fache
Kapazität
© Copyright 2009 EMC Corporation. All rights reserved. 3
- 5. EMC BRS Marktpositionen
Avamar
– Führende Deduplizierungs-Backupsoftware weltweit
– 4.500 Installationen
– 2.500 Kunden
Data Domain
– Führender Deduplizierungsspeicher weltweit
– 12.000 Installationen
– 4.300 Kunden
Disk Library
– Bestverkaufte VTL weltweit
– Mehr als 1 Mrd. US-$ Umsatz
NetWorker
– Unter den ersten drei Unternehmens-Backuplösungen
– 30.000 Kunden
© Copyright 2009 EMC Corporation. All rights reserved. 5
- 6. Analysten über Data Domain
―Data Domain has the largest market share, both in terms of
customers and appliances in production.‖
―Data Domain is a vendor that has the most ‘mind share’ in the deduplication space and
was an early provider with this technology.‖
Source: Gartner Report ID Number: G00165744 ―Four Technologies That Mid-sized Businesses Should Consider‖ Feb 2009
―Data Domain is the de facto leader in the market from a
customer deployment perspective.‖
―The leading supplier of data deduplication technology from a real-world implementation and
market penetration perspective is Data Domain.‖
Source: IDC Opinion, Teck Buyer Case Study, Doc. # 216452 Feb 2009
―Data Domain has 54% deduplication market share.‖
Source: The Taneja Group, September 2008
© Copyright 2009 EMC Corporation. All rights reserved. 6
- 7. Data Domain Deduplizierungsspeicher
Backup & Archiv
Anwendungen
CIFS, NFS,
NDMP, OpenStorage
Ethernet
Replication
VTL over FC
DD880 Appliance DD880 Appliance
4 Höheneinheiten
2 - 6 Ports
10 und 1 Gbit Ethernet; 4 Gbit Fibre Channel
RAID-6
5,4 bis 71 TByte nutzbare Kapazität
1 TByte oder 500 GByte 7,2k U/min SATA-Laufwerke
Dateisystem
NVRAM
N+1 Lüfter und redundante Hotplug-Netzteile
Einfache Integration in bestehende Umgebungen
© Copyright 2009 EMC Corporation. All rights reserved. 7
- 8. Hierarchie der Datenreduzierungs-
möglichkeiten für Backups
Standard-Speichersystem
1:1
Kompression LZ-Kompression
~ 2:1
Single-Instance-Speicher
Dateiebene
~ 3:1
Fix-Block, Fix-Block
Snapshots ~ 3:1
Variable Deduplizierung
Backup-Ziel, Segmente
Variable Segmente reduziert deutlich
~ 20:1 - die benötigte WAN Bandbreite
- den Stromverbrauch
- die Klimaaufwendungen
- die Kühlung
- die Verwaltung
© Copyright 2009 EMC Corporation. All rights reserved. 8
- 9. De-Dup Faktor – was heisst das eigentlich?
Faktor Space Saving
1 0%
2 50%
3 67%
4 75%
5 80%
6 83%
7 86%
8 87%
9 89%
10 90%
50 98%
100 99%
500 99.8%
© Copyright 2009 EMC Corporation. All rights reserved. 9
- 10. DeDuplizierung – Grundlagen
1. Dateneingang
2. Aufteilung in variable Segmente 4-
12KB und Deduplizierung
3. Komprimierung
4. Schreiben und Verifizieren Index &
Segmentinformationen
© Copyright 2009 EMC Corporation. All rights reserved. 10
- 11. Recovery: ―Data Invulnerability‖ Architektur
Datenüberprüfung
Prüfsumme
DeDup, auf Platte schreiben
Verifizieren
Selbstheilendes File System
Cleaning
Defrag
Verifizieren
Zusätzlicher Schutz
• RAID-6
• NVRAM
• N+1 Fan
• n Ports
• Snapshots
Trust but verify – hope is not a strategy !
© Copyright 2009 EMC Corporation. All rights reserved. 11
- 12. Daten-DeDuplizierungseffekt
Backup Logical Estimated Physical
Friday Full Backup Data Reduction
A B C D A E F G FRIDAY FULL 10 TB 2-4x 2.5 TB
Mon Incr A B H Monday Incr 1 TB 7-10x 100 GB
Tues Incr C B I Tuesday Incr 1 TB 7-10x 100 GB
Weds Incr E G J Wednesday Incr 1 TB 7-10x 100 GB
Thurs Incr A C K Thursday Incr 1 TB 7-10x 100 GB
Second Friday Full Backup 2nd FRIDAY FULL 10 TB 50-60x 180 GB
B C D E F L G H
TOTAL 24 TB 7.8x 3.08 TB
A BCDE FGH I J K L
© Copyright 2009 EMC Corporation. All rights reserved. 12
- 13. Daten-DeDuplizierungseffekt
Backup Logical Estimated Physical
Data Reduction
First Full 10.0 TB 4x 2.50 TB
Week 1 April 7 24.0 TB 8x 3.08 TB
Week 2 April 14 38.0 TB 10x 3.80 TB
Week 3 April 21 52.0 TB 12x 4.33 TB
Month 1 April 28 66.0 TB 14x 4.71 TB
Month 2 May 31 122 TB 17x 7.18 TB
Month 3 June 30 178 TB 19x 9.37 TB
Month 4 Juli 31 234 TB 20x 11.7 TB
TOTAL 234 TB 20x 11.7 TB
Längere Aufbewahrungszeiten mit der selben Diskkapazität !
© Copyright 2009 EMC Corporation. All rights reserved. 13
- 14. De-duplication Beyond Backup
Backup Archive Database Clients
SQL
File Mail
VMware
Virtual Machines
LAN nfs App App App App
SAN
cifs
OS OS OS OS
VCB
File Proxy
Virtualisation VMware Infrastructure 3
vmdk
Snapsho
t
Tier
2 VMware
ESX Host
Tier
1
CIFS NFS OST
NDMP DR Site
Primary
FC/iSCSI/NFS
Mainframe/ Storage
iSeries/ AS400 ESCON WAN
/ Replikation
FICON
Aussenstellen
Retention
Lock
© Copyright 2009 EMC Corporation. All rights reserved. 14
- 15. Replikation: WAN–Effizienz
90- 95% Bandbreitenreduzierung
5- 10%
DIR A
home
5- 10%
WAN
Backup Daten
5- 10%
home
Ziel: Data Center Hub
Quelle: Remote Sites
Echtes DR; reduziert WAN–Kosten; verbessert SLAs !
© Copyright 2009 EMC Corporation. All rights reserved. 15 15
- 16. DD Replicator Software:
One-to-Many Directory Replication
Replicates the same directory to multiple remote Data Domain systems
Increases protection—multiple copies to different disaster recovery sites
Data distribution for multi-site usage—QA, testing, development
One-to-Many Cascaded Replication with One-to-Many
Destination
Source
Destination
Source and
Source
destination
Destination
© Copyright 2009 EMC Corporation. All rights reserved. 16
- 17. Inline- im Vergleich zu Post-Process-
Deduplizierung
Post Process: Inline:
Deduplizierung nach dem Deduplizierung vor dem
Speichern Speichern
Speichern Deduplizierung Deduplizierung
Dreifache Zugriffe
auf Festplatten
Konkurrierende Prozesse Andere Aktivitäten bleiben
verlangsamen das System unbeeinflußt
− Kopien auf Band: Zu langsam zum − Vorhersagbar
Streamen − Einfacher
− Recovery: SLAs nicht vorhersagbar
− Replikation: findet erst nach Dedup statt
− Deduplizierung selbst kollidiert mit
Backup und Restore
Daher höherer Verwaltungsaufwand
© Copyright 2009 EMC Corporation. All rights reserved. 17
- 18. Online vs Post DeDuplizierung
Online DeDuplizierung Post DeDuplizierung
Backup DDUP Verifizierung Replikation
Backup
DDUP Verifizierung Replikation
Kein zusätzlicher Plattenbedarf geringere Zusätzlicher Platzbedarf höhereStromkosten
Stromkosten Höhere Software-Upgradegebühren notwendig
Geringere Software-Upgradegebühren Extrem I/O-lastig
notwendig Anfällig für Datenkonstistenzprobleme / hohe
Wahrscheinlichkeit für Diskfragmentierung
Replikation kann unmittelbar mit dem
Replikation kann erst nach Post-Deduplizierung
Backup angestoßen werden DR fähig angestoßen werden DR fähig ?
© Copyright 2009 EMC Corporation. All rights reserved. 18
- 20. New Q2 Capabilities: Building Upon
Data Domain Architectural Advantages
Data Domain SISL Scaling Architecture: CPU-Centric
5
Multi-controller
systems with global 2011 (est.)
deduplication
3
Throughput GB/s
Distributed processing
for single-controller
systems
1.5
DD880, July 2009
Industry’s fastest backup
storage controller
0.04
DD200 (2004)
1.25 70 > PB
Addressable capacity in terabytes
post-RAID (physical)
© Copyright 2009 EMC Corporation. All rights reserved. 20
- 21. New Q2 Data Domain Systems and Software
Retain, replicate, recover…better
Available May 2010
Systems
New Data Domain Global Deduplication Array
– Largest, fastest Data Domain deduplication storage system
Data Domain DD880 expansion
– Double the capacity
Software
New Data Domain Boost software
– Speeds backups by distributing parts of deduplication process to
backup server
New Data Domain Encryption software
– Industry’s first encryption of deduplicated data at rest
Data Domain Replicator software enhancements
– For small sites and one-to-many directory replication
© Copyright 2009 EMC Corporation. All rights reserved. 21
- 22. Data Domain Global Deduplication Array
Largest, fastest Data Domain deduplication storage system
New
Global deduplication and single namespace across
two DD880 controllers
– Speed: Up to 12.8 TB per hour (3.5 GB/s)
– Usable capacity: Up to 285 TB
– Logical capacity: Up to 14.2 PB
– Up to 270 concurrent write streams
– As replication target, up to 270 originators
Simplifies backup administration
Managed replication
Upgrade single DD880 to Global Deduplication Array
largest capacity • higher performance •
simplified management
© Copyright 2009 EMC Corporation. All rights reserved. 22
- 23. Also New: Data Domain DD880
Doubles Capacity
Data Domain Up to 142.5 TB (up to 7.1 PB logical)
Operating System 4.8,
DD880 12 shelves Support for up to 12 shelves
Upgrade kit for existing DD880
DD880
Logical capacity 2.8–7.1 PB
Raw capacity Up to 192 TB
Usable capacity Up to 142.5 TB
© Copyright 2009 EMC Corporation. All rights reserved. 23
- 24. DD Boost Software
New
Distributes parts of deduplication process to backup server
DD Boost – Licensable software works across Data Domain portfolio
Supports majority of backup software market
– Symantec NetBackup and Backup Exec currently
– EMC NetWorker support in 2H 2010
Speeds backups by up to 50%
Process more backups with existing resources
– 20–40% less overall impact to backup server
– 80–99% less LAN bandwidth
Enables Data Domain replication management from the
backup application
© Copyright 2009 EMC Corporation. All rights reserved. 24
- 25. DATA DOMAIN BOOST
Distributes Deduplication Process
Without DD Boost
LAN LAN
Application Backup server
With DD Boost Software
LAN DD Boost LAN
Application Backup server
Deduplication process distributed
through DD Boost
© Copyright 2009 EMC Corporation. All rights reserved. 25
- 26. DATA DOMAIN BOOST
What Gets Distributed?
With DD Boost
Speeds backups
Less backup ID Segment Unique?
server impact
Compress Write
Less bandwidth
LAN DD Boost LAN
Application Backup server
© Copyright 2009 EMC Corporation. All rights reserved. 26
- 27. DD Boost Across the Portfolio:
Up to 50% Faster
New
Global Deduplication Array
DD880
DD600
Appliance Series
Software options: DDX Array Series
DD Boost, DD Virtual Tape Library, Up to 16 Controllers
DD140 Remote
DD Replicator, DD Retention Lock, and
Office Appliance
DD Encryption
Global
DD140 DD610 DD630 DD660 DD690 DD880 Deduplication DDX Array
Array
Speed (other) 450 GB/hr 675 GB/hr 1.1 TB/hr 2.0 TB/hr 2.7 TB/hr 5.4 TB/hr 86.4. TB/hr
Speed (DD Boost) 490 GB/hr 1.3 TB/hr 2.1 TB/hr 2.7 TB/hr 3.9 TB/hr 8.8 TB/hr 12.8 TB/hr 140 TB/hr
Logical capacity 17–43 TB 75–195 TB 165–420 TB .520–1.31 PB .710–1.7 PB 2.8–7.1 PB 5.7–14 .2 PB 45.6–114 PB
Raw capacity 1.5 TB Up to 6 TB Up to 12 TB Up to 36 TB Up to 48 TB Up to 192 TB Up to 384 TB Up to 3.07 PB
Usable capacity 0.86 TB Up to 3.98 TB Up to 8.4 TB Up to 26.1 TB Up to 35.3 TB Up to 142.5 TB Up to 285 TB Up to 2.28 PB
© Copyright 2009 EMC Corporation. All rights reserved. 27
- 28. DD Encryption Software
Industry’s first encryption of deduplicated data at rest
New
Inline: deduplication and Protects against loss of disk or system
encryption before storing – Inline encryption provides immediate protection
Deduplication + Encryption
while preserving deduplication
– Works with all protocols and applications
Software-based, user-selectable AES-128
or AES-256
Replicate encrypted data (payload only,
not session) using DD Replicator
© Copyright 2009 EMC Corporation. All rights reserved. 28
- 29. Data Domain Retention Lock Software
Wandelt Data Domain Systeme in ein WORM Medium
mit In-Line Deduplizierung
Schutz gegen alle logischen Fehler
Hohe Kosteneinsparung durch Deduplizierung
Management auf Datei Ebene
Retention Policy’s auf Datei Ebene
Freigabe des Speicherplatzes nach Ablauf der
Retention Zeit
Umfangreiche Kompatibilität
Anbindung an alle gängigen Daten- und
Archivierungsysteme
Datenschutz in Verbindung mit Hochverfügbarkeit
Datensicherheit durch RAID6
Integrierte Daten Unverwundbarkeits Architektur mit
einer mehrstufigen Datenverifizierung
© Copyright 2009 EMC Corporation. All rights reserved. 29
- 30. Archivierung von NAS Daten
– Einsparpotiential von bis zu 80%
– Verlängerung der Lebenszeit der Primärspeichersysteme durch Auslagerung der Daten
auf hoch effiziente Data Domain Systeme
Clients
Applikationen
CIFS / NFS
© Copyright 2009 EMC Corporation. All rights reserved. 30
- 34. Kundenbeispiele File+Oracle Sicherungen
auf Data Domain – die ersten 3 Wochen
Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp Beispiel auf 3 Wochen Retention: 14.11-
(GiB) (GiB) Factor Factor Factor (Reduction %) 07.12.09
--------------- -------- --------- ----------- ---------- -------------
Currently Used: 258311.3 26808.9 - - 9.4x (89.4)
• 258TB gesichert - 27.3TB auf DD belegt
Written:* • Overall Ergebnis 9.5x (89.4%)
Last 7 days 67010.7 4743.8 6.2x 2.3x 14.1x (92.9) • Last 7 Day Ergebnis 14.1x (92.9%)
Last 24 hrs 10970.0 687.7 7.2x 2.2x 16.0x (93.7) • Last 24 h Ergebnis 12.3x (91.9%)
--------------- -------- --------- ----------- ---------- ------------- • Aus den höheren Last 7 days und last 24h
Werten lässt sich erkennen, dass das
tägliche Datenwachstum auf der Data
Domain immer geringer wird.
• Pre-Comp:
Backup Datenvolumen, welches vom Backup
Server geschrieben wurde und auf der
Maschine gespeichert ist.
• Post-Comp:
Datenmenge die nach Dedupe und
Compression auf den Platten gespeichert ist
• Comp Ratio:
Overall Datenreduktionsfaktor
© Copyright 2009 EMC Corporation. All rights reserved. 34
- 35. Kundenbeispiele File+Oracle Sicherungen
auf Data Domain – Zeitraum >1 Jahr
Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp Beispiel auf >1 Jar Retention:
(GiB) (GiB) Factor Factor Factor (Reduction %)
• 735TB gesichert – 31TB auf DD belegt
--------------- -------- --------- ----------- ---------- -------------
Currently Used: 735084.3 31090.5 - - 23.6x (95.8)
• Overall Ergebnis 23.6x (95.8%)
Written:*
Last 7 days 28745.7 1731.4 12.3x 1.3x 16.6x (94.0) •Der Einbruch in der Graphik zeigt das
Last 24 hrs 1747.5 102.2 11.2x 1.5x 17.1x (94.2) Ausaltern der Backup die Ihre Retention
--------------- -------- --------- ----------- ---------- ------------- von 1 Jahr erreicht haben
• Pre-Comp:
Backup Datenvolumen, welches vom Backup
Server geschrieben wurde und auf der
Maschine gespeichert ist.
• Post-Comp:
Datenmenge die nach Dedupe und
Compression auf den Platten gespeichert ist
• Comp Ratio:
Overall Datenreduktionsfaktor
© Copyright 2009 EMC Corporation. All rights reserved. 35
- 36. Kundenbeispiel ... die ersten Tage
Dedupe ratio of production data
1st Full Backup:
3.4x (70.6%) data reduction
45TB data saved
=> 14.3TB used on Data Domain disk
Overall:
5.0x (80.0%) data reduction
77.8TB data saved
=> 15.6TB used on Data Domain disk
Subsequential Backups:
~20x (95%)
20.4TB data saved
=> 991GB used on Data Domain disk
© Copyright 2009 EMC Corporation. All rights reserved. 36
- 37. Kundenbeispiel Oracle DB’s mit
~10% Änderungsrate/ Tag
auf Data Domain – Zeitraum 4 Wochen
Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp
(GiB) (GiB) Factor Factor Factor (Reduction %)
--------------- -------- --------- ----------- ---------- -------------
Currently Used: 112830.2 10701.6 - - 10.5x (90.5)
Written:
Last 7 days 43718.3 2745.6 5.4x 3.0x 15.9x (93.7)
Last 24 hrs 12197.0 815.3 4.6x 3.2x 15.0x (93.3)
--------------- -------- --------- ----------- ---------- -------------
113TB gesichert – 10.7TB auf DD belegt
• Overall Ergebnis 10.5x (90.5%)
• Pre-Comp:
Backup Datenvolumen, welches vom Backup
Server geschrieben wurde und auf der
Maschine gespeichert ist.
• Post-Comp:
Datenmenge die nach Dedupe und
Compression auf den Platten gespeichert ist
• Comp Ratio:
Overall Datenreduktionsfaktor
© Copyright 2009 EMC Corporation. All rights reserved. 37
- 38. Zusammenfassend - Warum Data Domain ?
• Marktführer mit + 4.300 Kunden, + 12.000 installierter Systeme und 54% Marktanteil
(The Taneja Group, September 2008)
• Entwicklung & Einsatz der besten DDUP-Technologie (In-Line, CPU-basiert etc.)
• Datenreduktion von über 90% führt zu Verkürzung von Wiederherstellungs- zeiten durch
viel längere Aufbewahrung der Backupläufe auf Platte
• Sicherestes und am Markt verfügbares DDUP–System
• Hohe Skalierbarkeit & Performance mit bis zu 12.8TB/hr
• Umsetzung „echter― DR-Konzepte STORAGE MAGAZINE'S Products of the Year
• Applikationsübergreifende Best Backup Hardware
DeDuplizierung Data Domain DD690
Deduplication
• Real Green-IT: Drastische Reduktion der Storage System
Stromkosten, des Platzbedarfes http://searchstorage.techtarget.com/productsOfTheYear/0,294801,sid5_ayr2008,00.html
und der Klimakosten durch online DDUP
© Copyright 2009 EMC Corporation. All rights reserved. 38