Teradata Warehouse Speicherort für Unternehmensrelevante Daten Verkaufzahlen Usagezahlen etc. Analytisches DWH Statistiken für Marketingzwecke passiv = Daten werden nur übernommen Operatives DWH Gutschriftenverteilung (Frei- SMS) aktiv = Daten werden erzeugt
Architektur Anforderungen Hardware Infrastruktur Performance Zusatz Zusammenfassung Hardware (bsp. Vodafone) Agenda
Architektur
Architektur minimaler Administrationsaufwand Hohe Verfügbarkeit und Stabilität Optimale Skalierbarkeit der Hardware Hohe Performance Unbedingte Parallelität ! Anforderungen
Architektur
Architektur Access Module Processor PE AMP Console Utilities Systemkonfiguration Tabellenwiederherstellung File System Verwaltung der Virtual Discs AMP Worker Task Functions Session starten & beenden select, join, insert, etc.
Architektur Parsing Engine PE Dispatcher Versenden der Querys Kontrolle Rückmeldung an den User Parser / Optimizer Syntax überprüfen aufteilen der Querys Session Control Session starten
Architektur Nodes  (Knoten) PE PE AMP AMP AMP AMP VNET P arsing   E ngines A ccess  M odule  P rocessors V irtual   NET work
Architektur Cliquenbildung Nodes Disk Array 4 Nodes bilden in der Regel eine Clique !
Architektur Teradata BYNET  (Banyan Network) BYNET Nodes Disk Array
Architektur Verfügbarkeit Nodes Disk Array BYNET
Architektur Verfügbarkeit Alle Daten der Disks werden auf Bändern aufgezeichnet !
Architektur Verfügbarkeit zweifache Redundanz (BYNET) Migration der VPROCs (PE & AMP) Fallback- Optionen (Bandsicherung)
Funktionen
Funktionen Gleichmäßige Verteilung über die Hardware Gleichmäßigkeit 99,95 %  Verteilung nicht Zufällig Records mit gleichem PK auf dem selben AMP Hash- Tabelle speichert Positionen Der Hash- Algorithmus
Funktionen „ Hardware load balancing“ AMP 16 AMP 17 AMP 18 AMP 19 AM 5 User Kunde Billing Usage ... Alle Daten / Tabellen wurden gleichmäßig über die gesamte Hardware verteilt !
Funktionen SELECT, JOIN Traditionelle, „Parallele“ Datenbank
Funktionen Teradata Datenbank SELECT, JOIN
Funktionen Die Funktion „Sync- Scan“   101896  Muster, Max 546.97 08/21/97 297362  Murks, Müller 34.65  07/16/97 000893  Smith, John 254.01 05/08/97 919975  Xxxxx, Hal 320.12 09/10/97 401864  Xxxxx, Loui 12.15  03/19/97 Query1 Query2 Query3
Zusatz
Zusatz Bedingungslose Parallelität Parallel- funktionierende Arbeitseinheiten (PE & AMP) Dynamische Skalierung Cliquenbildung Hohe Stabilität Zweifach redundantes, bidirektionales BYNET VPROC Migration & Bandsicherung „ Selbstverwaltendes System“ Zusammenfassung
Zusatz Hardware am Beispiel Vodafone 176  Knoten (Nodes) 609  CPUs (700MHz - 3,8 GHz) 692   GB   RAM 156,2   TB   HDD (5880 Stück) 100 t  Gesamtgewicht 110 m²  Stellfläche 250 kWh/Monat  Stromverbrauch
Teradata Warehouse Vielen Dank für die Aufmerksamkeit !!
 
Performance Bedingungslose Parallelität
Performance Bedingungslose Parallelität kostensparender Optimizer Parallelität ist automatisch Parallelität ist „bedingungslos“ für jeden Query - Step keine seriellen Operationen
Teradata Warehouse Der Hash- Algorithmus   f(x) Row Hash 32 bit Hash Bucket 16 bit Reminder 16 bit 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 3 4 5 6 7 8 9 10 1 2 3 5 6 00 01 02 03 04 05 06 07 09 0A FE FF 1 2 3 4 5 6 7 8 9 1 2 00 01 02 FF ... ... AMP 4 AMP 5 AMP 6 AMP 7 AMP 3 AMP 2 AMP 1 0000001011111110 = 02FE 004711 Row Hash 32 bit Uniqueness 32 bit Row ID  64 bit
Teradata Warehouse Der Hash- Algorithmus   Primär-Index 004711 Hash-Algorithmus 0000001011111110 Umwandlung 02FE Hash-Tabelle AMP 5
Architektur Hardware Infrastruktur Bandsicherung Server LAN Lade Rechner (UNIX) Administratoren Admin LAN MVS Mainframe End-Anwender Office LAN

NCR Teradata Datawarehouse - Technical Overview

  • 1.
  • 2.
    Teradata Warehouse Speicherortfür Unternehmensrelevante Daten Verkaufzahlen Usagezahlen etc. Analytisches DWH Statistiken für Marketingzwecke passiv = Daten werden nur übernommen Operatives DWH Gutschriftenverteilung (Frei- SMS) aktiv = Daten werden erzeugt
  • 3.
    Architektur Anforderungen HardwareInfrastruktur Performance Zusatz Zusammenfassung Hardware (bsp. Vodafone) Agenda
  • 4.
  • 5.
    Architektur minimaler AdministrationsaufwandHohe Verfügbarkeit und Stabilität Optimale Skalierbarkeit der Hardware Hohe Performance Unbedingte Parallelität ! Anforderungen
  • 6.
  • 7.
    Architektur Access ModuleProcessor PE AMP Console Utilities Systemkonfiguration Tabellenwiederherstellung File System Verwaltung der Virtual Discs AMP Worker Task Functions Session starten & beenden select, join, insert, etc.
  • 8.
    Architektur Parsing EnginePE Dispatcher Versenden der Querys Kontrolle Rückmeldung an den User Parser / Optimizer Syntax überprüfen aufteilen der Querys Session Control Session starten
  • 9.
    Architektur Nodes (Knoten) PE PE AMP AMP AMP AMP VNET P arsing E ngines A ccess M odule P rocessors V irtual NET work
  • 10.
    Architektur Cliquenbildung NodesDisk Array 4 Nodes bilden in der Regel eine Clique !
  • 11.
    Architektur Teradata BYNET (Banyan Network) BYNET Nodes Disk Array
  • 12.
  • 13.
    Architektur Verfügbarkeit AlleDaten der Disks werden auf Bändern aufgezeichnet !
  • 14.
    Architektur Verfügbarkeit zweifacheRedundanz (BYNET) Migration der VPROCs (PE & AMP) Fallback- Optionen (Bandsicherung)
  • 15.
  • 16.
    Funktionen Gleichmäßige Verteilungüber die Hardware Gleichmäßigkeit 99,95 % Verteilung nicht Zufällig Records mit gleichem PK auf dem selben AMP Hash- Tabelle speichert Positionen Der Hash- Algorithmus
  • 17.
    Funktionen „ Hardwareload balancing“ AMP 16 AMP 17 AMP 18 AMP 19 AM 5 User Kunde Billing Usage ... Alle Daten / Tabellen wurden gleichmäßig über die gesamte Hardware verteilt !
  • 18.
    Funktionen SELECT, JOINTraditionelle, „Parallele“ Datenbank
  • 19.
  • 20.
    Funktionen Die Funktion„Sync- Scan“ 101896 Muster, Max 546.97 08/21/97 297362 Murks, Müller 34.65 07/16/97 000893 Smith, John 254.01 05/08/97 919975 Xxxxx, Hal 320.12 09/10/97 401864 Xxxxx, Loui 12.15 03/19/97 Query1 Query2 Query3
  • 21.
  • 22.
    Zusatz Bedingungslose ParallelitätParallel- funktionierende Arbeitseinheiten (PE & AMP) Dynamische Skalierung Cliquenbildung Hohe Stabilität Zweifach redundantes, bidirektionales BYNET VPROC Migration & Bandsicherung „ Selbstverwaltendes System“ Zusammenfassung
  • 23.
    Zusatz Hardware amBeispiel Vodafone 176 Knoten (Nodes) 609 CPUs (700MHz - 3,8 GHz) 692 GB RAM 156,2 TB HDD (5880 Stück) 100 t Gesamtgewicht 110 m² Stellfläche 250 kWh/Monat Stromverbrauch
  • 24.
    Teradata Warehouse VielenDank für die Aufmerksamkeit !!
  • 25.
  • 26.
  • 27.
    Performance Bedingungslose Parallelitätkostensparender Optimizer Parallelität ist automatisch Parallelität ist „bedingungslos“ für jeden Query - Step keine seriellen Operationen
  • 28.
    Teradata Warehouse DerHash- Algorithmus f(x) Row Hash 32 bit Hash Bucket 16 bit Reminder 16 bit 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 3 4 5 6 7 8 9 10 1 2 3 5 6 00 01 02 03 04 05 06 07 09 0A FE FF 1 2 3 4 5 6 7 8 9 1 2 00 01 02 FF ... ... AMP 4 AMP 5 AMP 6 AMP 7 AMP 3 AMP 2 AMP 1 0000001011111110 = 02FE 004711 Row Hash 32 bit Uniqueness 32 bit Row ID 64 bit
  • 29.
    Teradata Warehouse DerHash- Algorithmus Primär-Index 004711 Hash-Algorithmus 0000001011111110 Umwandlung 02FE Hash-Tabelle AMP 5
  • 30.
    Architektur Hardware InfrastrukturBandsicherung Server LAN Lade Rechner (UNIX) Administratoren Admin LAN MVS Mainframe End-Anwender Office LAN

Hinweis der Redaktion

  • #8 Hier kommt die Geschichte SMP  MMP hin!! SMP = Symmetric Multiprocessing (eine einzige Node, die Softwareseitig dann ein BYNET simuliert) MMP = Multiple Parallel Processing (mehrere Nodes / Cliques in einem System)
  • #9 Hier kommt die Geschichte SMP  MMP hin!! SMP = (eine einzige Node, die Softwareseitig dann ein BYNET simuliert) MMP = Multiple Parallel Processing (mehrere Nodes / Cliques in einem System)
  • #11 Optimale Skalierbarkeit der Hardware: Neue Cliquen werden automatisch vom System erkannt und eingebunden
  • #14 Ausfälle: Ausfall eines BYNET Stranges Ausfall einzelner VPROCS Ausfall einer Node Ausfall eines Diskarrays Ausfall einer Clique
  • #24 „ Und zu guter letzt noch ein paar Zahlen um den Vortrag abzurunden“