SlideShare ist ein Scribd-Unternehmen logo
1 von 29
Downloaden Sie, um offline zu lesen
Boston Webinar
GPUs – Vom spezialisierten Coprozessor zum Numbercruncher
Wolfgang Stief
Senior Consultant
§  Gegründet 1992 – 25 Jahre Innovation
§  Supermicros ältester & größter globaler Partner — seit über 20 Jahren
§  Lösungshersteller mit Fokus auf Technologie (First-to-Market Strategie)
§  London HQ, Niederlassungen in London City, München, Mumbai,
Bangalore, New York. Weitere Expansion geplant.
§  Experten im Lösungs- und HPC-System-Design unter Verwendung von
Premium-Komponenten von Supermicro und ausgewählten Partnern
§  Supermicros Fastest Growing Partner
Über uns
§  Historie
§  Anwendungen mit GPUs
3D-Grafik, Multimedia, technisch-wissenschaftliche Berechnungen, Kryptographie
§  Hersteller und Produkte
§  Komponenten einer GPU
Memory, Bus-Systeme, Shader
§  Aus dem Boston Lieferprogramm
Agenda
§  Arcade-Automaten, ca. Mitte 1970er
Sprites
§  2D-Beschleunigung, ca. 1990+
geometrische Figuren, GUIs, Spiele,
Microsoft DirectDraw
§  3D-Beschleunigung, ca. Ende 1990er
Videospiel-Consolen, Ego-Shooter (Quake u. a.)
DirectX, Direct3D
Nvidia GeForce 3 > programmable shader
§  ATI Radeon 9700 (R300), 2002
Looping, Floating Point Mathematik
Historie
OldenburgerComputerMuseum
§  NVIDIA CUDA, 2007
Programmier-Modell, Programmierumgebung, Libraries
§  „Missbrauch“ der Shader-Units
Daten zur Berechnung als Texturen (SIMD)
Historie
ByTosaka(ownwork),CC-BY3.0,viaWikimediaCommons
Anwendungen — 3D-Grafik und Multimedia
Making Of You're Goddamn Right! by Riccardo Minervino
https://www.3dtotal.com/tutorial/1691-making-of-youre-goddamn-right-maya-zbrush-by-riccardo-minervino-character-male-actor
Anwendungen — 3D-Grafik und Multimedia
Demo: 10 Movies before and after special effects
https://www.youtube.com/watch?v=gXu6BrsE8mY
Anwendungen — VR / AR
Anwendungen — Ingenieurwesen
§  CAD/CAM/CIM
§  Architektur
§  Finite Elemente Methode (FEM)
§  Computational Fluid Dynamics (CFD)
§  Anlagenbau / Konstruktion
Anwendungen — Ingenieurwesen
Demo: Hyundai's New Theta Engine with GDI
(Gasoline Direct Injection) Technologyhttps://
www.youtube.com/watch?v=Pxvp9F-PS34
Anwendungen — Ingenieurwesen
Demo: Fluid Dynamics Simulation: Caeli | Design for
Automotive
https://www.youtube.com/watch?v=PfJycXfLIk0
Anwendungen — Wissenschaft
§  Datenvisualisierung
§  Simulation
Anwendungen — Kryptographie
§  Blockchain
Bitcoin, Ethereum etc.
§  Berechnung kryptographischer Hashes
§  Cryptoanalyse
nur bedingt geeignet
Anwendungen — Deep Learning
§  Matrizenmultiplikation und –Addition
§  sehr gut parallelisierbar
§  braucht keine FP-Genauigkeit
Modellvielfalt — NVIDIA
§  Tesla
HPC, AI, Deep Learning > kein Video-Ausgang
Pascal, Volta
§  Titan / Quadro
Multimedia, Engineering, Visualisierung
Pascal
§  GeForce
Gaming
Pascal, Maxwell
Modellvielfalt — AMD
§  Radeon Instinct
HPC, AI, Deep Learning > kein Video-Ausgang
Polaris, Fuji, Vega 10
§  Radeon Pro
Multimedia, Engineering, Visualisierung
Polaris, Vega 10
§  Radeon RX
Gaming
Polaris
Komponenten, Begriffe, Architektur
§  Shader
§  SIMD — Single Instruction Multiple Data
§  Streaming Multiprocessor, Next-Generation Compute Unit
§  GPU-Memory: HBM2, GDDR
§  Interconnects: NVLink, Infinity Fabric, PCIe
Shader
§  Programm, das einem Bildausschnitt bestimmte Eigenschaften
zuweist
§  Pixel Shader
Farbe/Helligkeit für einen Bildpunkt
§  Vertex Shader
Raum-Koordinate (Vektor) ➛ 2D-Darstellung
§  Geometry Shader
Schatten, Überschneidungen, Verdeckungen
§  Tesselation Shader
komplexe Berechnungen für fotorealistische Ergebnisse
Single Instruction Multiple Data — SIMD
§  Differentialgleichungen
Finite Elemente Methode
§  Lösen von Gleichungssystemen
für jeden Gitterknotenpunkt
lineares Gleichungssystem
§  überwiegend Matrizenmultiplikation
Single Instruction Multiple Data — SIMD
§  Matrizenmultiplikation
§  Vektor-Arithmetik
1
2
3
4
5 6
7 8
2 4
6 8
× +
26 30
38 44
+
2 4
6 8
28 34
44 52
=
=
1×5 + 3×7
2×5 + 4×7
1×6 + 3×8
2×6 + 4×8
2 4
6 8
+ =
Processing Units
NVIDIA Volta
Streaming
Multiprocessor (SM)
> 84 SM
> 64 CUDA-Cores/SM
> 8 Tensor-Cores/SM
> 6048 Cores/Volta AMD Vega 10
Next-Generation
Compute Unit (NCU)
> 64 NCU
> 64 Cores/NCU
> 4096 Cores / Vega 10
Processing Units — NVIDIA Volta
Processing Units — AMD Vega
Memory für GPUs
§  Herausforderung:
sehr viele Cores wollen Memoryzugriff
§  Bottleneck: Speicherbandbreite
§  GDDR5: 40 GB/s
5 Gbit/s/Pin @ 67 Data Pins
§  HBM2: 256 GB/s
NVIDIA Volta, Radeon Vega
§  DDR4: 25.6 MB/s (!)
Interconnects
§  Anforderung: Multi-GPU-Systeme und
Bandbreite zum CPU-Memory
§  NVIDIA NVLink und NVLink 2
160 GB/s und 300 GB/s
auch in IBM POWER8/9 verfügbar
§  AMD Infinity Fabric
Weiterentwicklung von HyperTransport
max. 42.6 GB/s (aktuell)
§  PCIe 4.0
1.9 GB/s je Lane (typ. x8 od. x16)
Boston Grafikworkstation — Venom
§  Intel Xeon Scalable Processor Family
Intel Skylake
§  NVIDIA Quadro (alle Karten)
§  max. 768 GB DDR4 Memory
§  2x M.2 NVMe SSD
10x SATA HDD-Slots
Boston Mining Box
§  Intel Broadwell-u
§  9x Radeon RX470
Boston Machine Learning Appliance
§  custom built, je nach Anforderung
§  z. B. Intel Broadwell-EP
§  max. 24x 2.5“ SATA3 HDD
§  8x NVIDIA GeForce GTX 1080
§  1 TB DDR4 ECC RAM
§  vorinstalliert: Ubuntu/CenOS Linux, NVIDIA CUDA, TensorFlow
Library, weitere DL/ML-Libraries und Frameworks nach Anforderung
§  DL-Trainings, Support
Kontakt
+49 89 9090199-3
www.boston-it.de
sales@boston-it.de
BostonITsolutions
@BostonGermany
Boston-server-&-storage-solutions-gmbh

Weitere ähnliche Inhalte

Was ist angesagt?

20111006 roadshow-sandy-bridge
20111006 roadshow-sandy-bridge20111006 roadshow-sandy-bridge
20111006 roadshow-sandy-bridgeWerner Fischer
 
Geforce PräSentation by Sebastian Berndt
Geforce PräSentation by Sebastian BerndtGeforce PräSentation by Sebastian Berndt
Geforce PräSentation by Sebastian Berndtgueste16dcd
 
Zukunftstrends: was bringt 2013 für die IT?
Zukunftstrends: was bringt 2013 für die IT?Zukunftstrends: was bringt 2013 für die IT?
Zukunftstrends: was bringt 2013 für die IT?Werner Fischer
 
AnyARK Gluster Brick 270TB (198TB netto) Datenblatt
AnyARK Gluster Brick 270TB (198TB netto) DatenblattAnyARK Gluster Brick 270TB (198TB netto) Datenblatt
AnyARK Gluster Brick 270TB (198TB netto) DatenblattManfred Ostermann
 
Private Cloud mit Open Source
Private Cloud mit Open SourcePrivate Cloud mit Open Source
Private Cloud mit Open SourceDaniel Schneller
 
Praktische Erfahrungen mit den kleinen SPARC S7-2 Servern
Praktische Erfahrungen mit den kleinen SPARC S7-2 ServernPraktische Erfahrungen mit den kleinen SPARC S7-2 Servern
Praktische Erfahrungen mit den kleinen SPARC S7-2 ServernJomaSoft
 
OSMC 2011 | Collectd in der großen weiten Welt - Anbindung des Datensammlers ...
OSMC 2011 | Collectd in der großen weiten Welt - Anbindung des Datensammlers ...OSMC 2011 | Collectd in der großen weiten Welt - Anbindung des Datensammlers ...
OSMC 2011 | Collectd in der großen weiten Welt - Anbindung des Datensammlers ...NETWAYS
 
backy - Image-basiertes Backup für virtuelle Maschinen
backy - Image-basiertes Backup für virtuelle Maschinenbacky - Image-basiertes Backup für virtuelle Maschinen
backy - Image-basiertes Backup für virtuelle MaschinenChristian Kauhaus
 
Hadoop aus IT-Operations-Sicht - Teil 2 (Hardware- und Netzwerkgrundlagen)
Hadoop aus IT-Operations-Sicht - Teil 2 (Hardware- und Netzwerkgrundlagen)Hadoop aus IT-Operations-Sicht - Teil 2 (Hardware- und Netzwerkgrundlagen)
Hadoop aus IT-Operations-Sicht - Teil 2 (Hardware- und Netzwerkgrundlagen)inovex GmbH
 
Integrierte und dedizierte Backup Lösung von GFI MAX
Integrierte und dedizierte Backup Lösung von GFI MAXIntegrierte und dedizierte Backup Lösung von GFI MAX
Integrierte und dedizierte Backup Lösung von GFI MAXMAX2014DACH
 

Was ist angesagt? (15)

Pc präsentation
Pc präsentationPc präsentation
Pc präsentation
 
20111006 roadshow-sandy-bridge
20111006 roadshow-sandy-bridge20111006 roadshow-sandy-bridge
20111006 roadshow-sandy-bridge
 
Geforce PräSentation by Sebastian Berndt
Geforce PräSentation by Sebastian BerndtGeforce PräSentation by Sebastian Berndt
Geforce PräSentation by Sebastian Berndt
 
Bürohaus Kaucher
Bürohaus KaucherBürohaus Kaucher
Bürohaus Kaucher
 
Zukunftstrends: was bringt 2013 für die IT?
Zukunftstrends: was bringt 2013 für die IT?Zukunftstrends: was bringt 2013 für die IT?
Zukunftstrends: was bringt 2013 für die IT?
 
AnyARK Gluster Brick 270TB (198TB netto) Datenblatt
AnyARK Gluster Brick 270TB (198TB netto) DatenblattAnyARK Gluster Brick 270TB (198TB netto) Datenblatt
AnyARK Gluster Brick 270TB (198TB netto) Datenblatt
 
Shuttle Neuheiten 2011 (DE)
Shuttle Neuheiten 2011 (DE)Shuttle Neuheiten 2011 (DE)
Shuttle Neuheiten 2011 (DE)
 
Private Cloud mit Open Source
Private Cloud mit Open SourcePrivate Cloud mit Open Source
Private Cloud mit Open Source
 
Grafikkarten Vergleich
Grafikkarten VergleichGrafikkarten Vergleich
Grafikkarten Vergleich
 
Laptop
LaptopLaptop
Laptop
 
Praktische Erfahrungen mit den kleinen SPARC S7-2 Servern
Praktische Erfahrungen mit den kleinen SPARC S7-2 ServernPraktische Erfahrungen mit den kleinen SPARC S7-2 Servern
Praktische Erfahrungen mit den kleinen SPARC S7-2 Servern
 
OSMC 2011 | Collectd in der großen weiten Welt - Anbindung des Datensammlers ...
OSMC 2011 | Collectd in der großen weiten Welt - Anbindung des Datensammlers ...OSMC 2011 | Collectd in der großen weiten Welt - Anbindung des Datensammlers ...
OSMC 2011 | Collectd in der großen weiten Welt - Anbindung des Datensammlers ...
 
backy - Image-basiertes Backup für virtuelle Maschinen
backy - Image-basiertes Backup für virtuelle Maschinenbacky - Image-basiertes Backup für virtuelle Maschinen
backy - Image-basiertes Backup für virtuelle Maschinen
 
Hadoop aus IT-Operations-Sicht - Teil 2 (Hardware- und Netzwerkgrundlagen)
Hadoop aus IT-Operations-Sicht - Teil 2 (Hardware- und Netzwerkgrundlagen)Hadoop aus IT-Operations-Sicht - Teil 2 (Hardware- und Netzwerkgrundlagen)
Hadoop aus IT-Operations-Sicht - Teil 2 (Hardware- und Netzwerkgrundlagen)
 
Integrierte und dedizierte Backup Lösung von GFI MAX
Integrierte und dedizierte Backup Lösung von GFI MAXIntegrierte und dedizierte Backup Lösung von GFI MAX
Integrierte und dedizierte Backup Lösung von GFI MAX
 

Ähnlich wie GPUs — Vom spezialisierten Coprozessor zum Numbercruncher

Citrix Day 2014: HDX 3D for Professional Graphics
Citrix Day 2014: HDX 3D for Professional GraphicsCitrix Day 2014: HDX 3D for Professional Graphics
Citrix Day 2014: HDX 3D for Professional GraphicsDigicomp Academy AG
 
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDA
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDASchulung: Einführung in das GPU-Computing mit NVIDIA CUDA
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDAJörn Dinkla
 
GPU-beschleunigtes Desktop-Remoting 2014-06 (Citrix Solutions Exchange 2014)
GPU-beschleunigtes Desktop-Remoting 2014-06 (Citrix Solutions Exchange 2014)GPU-beschleunigtes Desktop-Remoting 2014-06 (Citrix Solutions Exchange 2014)
GPU-beschleunigtes Desktop-Remoting 2014-06 (Citrix Solutions Exchange 2014)bluecue consulting
 
Gaming and Cloud Computing revised
Gaming and Cloud Computing revisedGaming and Cloud Computing revised
Gaming and Cloud Computing revisedMarke Schlerner
 
Docker Workshop Experten Forum Stuttgart 2015, Agile Methoden GmbH
Docker Workshop Experten Forum Stuttgart 2015, Agile Methoden GmbHDocker Workshop Experten Forum Stuttgart 2015, Agile Methoden GmbH
Docker Workshop Experten Forum Stuttgart 2015, Agile Methoden GmbHagilemethoden
 
Aber schnell! Top HTML5 Performance Tipps für Hybrid- und Web-Apps
Aber schnell! Top HTML5 Performance Tipps für Hybrid- und Web-AppsAber schnell! Top HTML5 Performance Tipps für Hybrid- und Web-Apps
Aber schnell! Top HTML5 Performance Tipps für Hybrid- und Web-AppsGregor Biswanger
 
.NET Gadgeteer // msg@dnc12
.NET Gadgeteer // msg@dnc12.NET Gadgeteer // msg@dnc12
.NET Gadgeteer // msg@dnc12Holger Wendel
 
Site Speed EXTREME - SEOkomm 2014
Site Speed EXTREME - SEOkomm 2014Site Speed EXTREME - SEOkomm 2014
Site Speed EXTREME - SEOkomm 2014Bastian Grimm
 
Dataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesDataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesQAware GmbH
 
Presentation Netgear ReadyDATA Launch, 11. Juli 2013
Presentation Netgear ReadyDATA Launch, 11. Juli 2013Presentation Netgear ReadyDATA Launch, 11. Juli 2013
Presentation Netgear ReadyDATA Launch, 11. Juli 2013Netgear_Business_DE
 
Oracle Engineered Systems - Chance oder Risiko?
Oracle Engineered Systems - Chance oder Risiko?Oracle Engineered Systems - Chance oder Risiko?
Oracle Engineered Systems - Chance oder Risiko?Trivadis
 
openstack Übersicht @GPN15
openstack Übersicht @GPN15openstack Übersicht @GPN15
openstack Übersicht @GPN15m1no
 
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...BOSTON Server & Storage Solutions GmbH
 
Grafikkarten Testergebnisse
Grafikkarten TestergebnisseGrafikkarten Testergebnisse
Grafikkarten Testergebnissegrafikarta
 
Weltvermessen mit OpenDataCam - Wie ich einmal eine Viertelmillionen Autos ge...
Weltvermessen mit OpenDataCam - Wie ich einmal eine Viertelmillionen Autos ge...Weltvermessen mit OpenDataCam - Wie ich einmal eine Viertelmillionen Autos ge...
Weltvermessen mit OpenDataCam - Wie ich einmal eine Viertelmillionen Autos ge...Stephan Hochhaus
 
Josua Braun, Senior Marketing Manager Storage @ Netgear
Josua Braun, Senior Marketing Manager Storage @ NetgearJosua Braun, Senior Marketing Manager Storage @ Netgear
Josua Braun, Senior Marketing Manager Storage @ NetgearNetgear_Business_DE
 
Grafikkarten/Soundkarten
Grafikkarten/SoundkartenGrafikkarten/Soundkarten
Grafikkarten/SoundkartenOctopus
 

Ähnlich wie GPUs — Vom spezialisierten Coprozessor zum Numbercruncher (20)

Citrix Day 2014: HDX 3D for Professional Graphics
Citrix Day 2014: HDX 3D for Professional GraphicsCitrix Day 2014: HDX 3D for Professional Graphics
Citrix Day 2014: HDX 3D for Professional Graphics
 
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDA
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDASchulung: Einführung in das GPU-Computing mit NVIDIA CUDA
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDA
 
GPU-beschleunigtes Desktop-Remoting 2014-06 (Citrix Solutions Exchange 2014)
GPU-beschleunigtes Desktop-Remoting 2014-06 (Citrix Solutions Exchange 2014)GPU-beschleunigtes Desktop-Remoting 2014-06 (Citrix Solutions Exchange 2014)
GPU-beschleunigtes Desktop-Remoting 2014-06 (Citrix Solutions Exchange 2014)
 
Gaming and Cloud Computing revised
Gaming and Cloud Computing revisedGaming and Cloud Computing revised
Gaming and Cloud Computing revised
 
Docker Workshop Experten Forum Stuttgart 2015, Agile Methoden GmbH
Docker Workshop Experten Forum Stuttgart 2015, Agile Methoden GmbHDocker Workshop Experten Forum Stuttgart 2015, Agile Methoden GmbH
Docker Workshop Experten Forum Stuttgart 2015, Agile Methoden GmbH
 
Aber schnell! Top HTML5 Performance Tipps für Hybrid- und Web-Apps
Aber schnell! Top HTML5 Performance Tipps für Hybrid- und Web-AppsAber schnell! Top HTML5 Performance Tipps für Hybrid- und Web-Apps
Aber schnell! Top HTML5 Performance Tipps für Hybrid- und Web-Apps
 
.NET Gadgeteer // msg@dnc12
.NET Gadgeteer // msg@dnc12.NET Gadgeteer // msg@dnc12
.NET Gadgeteer // msg@dnc12
 
Site Speed EXTREME - SEOkomm 2014
Site Speed EXTREME - SEOkomm 2014Site Speed EXTREME - SEOkomm 2014
Site Speed EXTREME - SEOkomm 2014
 
Dataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesDataservices - Data Processing mit Microservices
Dataservices - Data Processing mit Microservices
 
Presentation Netgear ReadyDATA Launch, 11. Juli 2013
Presentation Netgear ReadyDATA Launch, 11. Juli 2013Presentation Netgear ReadyDATA Launch, 11. Juli 2013
Presentation Netgear ReadyDATA Launch, 11. Juli 2013
 
Oracle Engineered Systems - Chance oder Risiko?
Oracle Engineered Systems - Chance oder Risiko?Oracle Engineered Systems - Chance oder Risiko?
Oracle Engineered Systems - Chance oder Risiko?
 
.NET Gadgeteer
.NET Gadgeteer.NET Gadgeteer
.NET Gadgeteer
 
openstack Übersicht @GPN15
openstack Übersicht @GPN15openstack Übersicht @GPN15
openstack Übersicht @GPN15
 
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
 
Boston webcast nv_me_2016-09
Boston webcast nv_me_2016-09Boston webcast nv_me_2016-09
Boston webcast nv_me_2016-09
 
Grafikkarten Testergebnisse
Grafikkarten TestergebnisseGrafikkarten Testergebnisse
Grafikkarten Testergebnisse
 
SuperSUSE – die Lösung für dynamisch wachsenden Speicher
SuperSUSE – die Lösung für dynamisch wachsenden SpeicherSuperSUSE – die Lösung für dynamisch wachsenden Speicher
SuperSUSE – die Lösung für dynamisch wachsenden Speicher
 
Weltvermessen mit OpenDataCam - Wie ich einmal eine Viertelmillionen Autos ge...
Weltvermessen mit OpenDataCam - Wie ich einmal eine Viertelmillionen Autos ge...Weltvermessen mit OpenDataCam - Wie ich einmal eine Viertelmillionen Autos ge...
Weltvermessen mit OpenDataCam - Wie ich einmal eine Viertelmillionen Autos ge...
 
Josua Braun, Senior Marketing Manager Storage @ Netgear
Josua Braun, Senior Marketing Manager Storage @ NetgearJosua Braun, Senior Marketing Manager Storage @ Netgear
Josua Braun, Senior Marketing Manager Storage @ Netgear
 
Grafikkarten/Soundkarten
Grafikkarten/SoundkartenGrafikkarten/Soundkarten
Grafikkarten/Soundkarten
 

Mehr von BOSTON Server & Storage Solutions GmbH

Mehr von BOSTON Server & Storage Solutions GmbH (7)

Storage, Backup und Business Continuity mit Open-E
Storage, Backup und Business Continuity mit Open-EStorage, Backup und Business Continuity mit Open-E
Storage, Backup und Business Continuity mit Open-E
 
Seagate – Next Level Storage (Webinar mit Boston Server & Storage, 2018 09-28)
Seagate – Next Level Storage (Webinar mit Boston Server & Storage,  2018 09-28)Seagate – Next Level Storage (Webinar mit Boston Server & Storage,  2018 09-28)
Seagate – Next Level Storage (Webinar mit Boston Server & Storage, 2018 09-28)
 
Welcome to the Datasphere – the next level of storage
Welcome to the Datasphere – the next level of storageWelcome to the Datasphere – the next level of storage
Welcome to the Datasphere – the next level of storage
 
Datera — Elastic Data Fabric Storage für das Rechenzentrum von heute
Datera — Elastic Data Fabric Storage für das Rechenzentrum von heuteDatera — Elastic Data Fabric Storage für das Rechenzentrum von heute
Datera — Elastic Data Fabric Storage für das Rechenzentrum von heute
 
Webinar: Boston Igloo Plus mit AccelStor FlexiRemap Technologie
Webinar: Boston Igloo Plus mit AccelStor FlexiRemap TechnologieWebinar: Boston Igloo Plus mit AccelStor FlexiRemap Technologie
Webinar: Boston Igloo Plus mit AccelStor FlexiRemap Technologie
 
Webinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap Technology
Webinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap TechnologyWebinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap Technology
Webinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap Technology
 
Boston webcast hyperconverged_2016-06
Boston webcast hyperconverged_2016-06Boston webcast hyperconverged_2016-06
Boston webcast hyperconverged_2016-06
 

GPUs — Vom spezialisierten Coprozessor zum Numbercruncher

  • 1. Boston Webinar GPUs – Vom spezialisierten Coprozessor zum Numbercruncher Wolfgang Stief Senior Consultant
  • 2. §  Gegründet 1992 – 25 Jahre Innovation §  Supermicros ältester & größter globaler Partner — seit über 20 Jahren §  Lösungshersteller mit Fokus auf Technologie (First-to-Market Strategie) §  London HQ, Niederlassungen in London City, München, Mumbai, Bangalore, New York. Weitere Expansion geplant. §  Experten im Lösungs- und HPC-System-Design unter Verwendung von Premium-Komponenten von Supermicro und ausgewählten Partnern §  Supermicros Fastest Growing Partner Über uns
  • 3. §  Historie §  Anwendungen mit GPUs 3D-Grafik, Multimedia, technisch-wissenschaftliche Berechnungen, Kryptographie §  Hersteller und Produkte §  Komponenten einer GPU Memory, Bus-Systeme, Shader §  Aus dem Boston Lieferprogramm Agenda
  • 4. §  Arcade-Automaten, ca. Mitte 1970er Sprites §  2D-Beschleunigung, ca. 1990+ geometrische Figuren, GUIs, Spiele, Microsoft DirectDraw §  3D-Beschleunigung, ca. Ende 1990er Videospiel-Consolen, Ego-Shooter (Quake u. a.) DirectX, Direct3D Nvidia GeForce 3 > programmable shader §  ATI Radeon 9700 (R300), 2002 Looping, Floating Point Mathematik Historie OldenburgerComputerMuseum
  • 5. §  NVIDIA CUDA, 2007 Programmier-Modell, Programmierumgebung, Libraries §  „Missbrauch“ der Shader-Units Daten zur Berechnung als Texturen (SIMD) Historie ByTosaka(ownwork),CC-BY3.0,viaWikimediaCommons
  • 6. Anwendungen — 3D-Grafik und Multimedia Making Of You're Goddamn Right! by Riccardo Minervino https://www.3dtotal.com/tutorial/1691-making-of-youre-goddamn-right-maya-zbrush-by-riccardo-minervino-character-male-actor
  • 7. Anwendungen — 3D-Grafik und Multimedia Demo: 10 Movies before and after special effects https://www.youtube.com/watch?v=gXu6BrsE8mY
  • 9. Anwendungen — Ingenieurwesen §  CAD/CAM/CIM §  Architektur §  Finite Elemente Methode (FEM) §  Computational Fluid Dynamics (CFD) §  Anlagenbau / Konstruktion
  • 10. Anwendungen — Ingenieurwesen Demo: Hyundai's New Theta Engine with GDI (Gasoline Direct Injection) Technologyhttps:// www.youtube.com/watch?v=Pxvp9F-PS34
  • 11. Anwendungen — Ingenieurwesen Demo: Fluid Dynamics Simulation: Caeli | Design for Automotive https://www.youtube.com/watch?v=PfJycXfLIk0
  • 12. Anwendungen — Wissenschaft §  Datenvisualisierung §  Simulation
  • 13. Anwendungen — Kryptographie §  Blockchain Bitcoin, Ethereum etc. §  Berechnung kryptographischer Hashes §  Cryptoanalyse nur bedingt geeignet
  • 14. Anwendungen — Deep Learning §  Matrizenmultiplikation und –Addition §  sehr gut parallelisierbar §  braucht keine FP-Genauigkeit
  • 15. Modellvielfalt — NVIDIA §  Tesla HPC, AI, Deep Learning > kein Video-Ausgang Pascal, Volta §  Titan / Quadro Multimedia, Engineering, Visualisierung Pascal §  GeForce Gaming Pascal, Maxwell
  • 16. Modellvielfalt — AMD §  Radeon Instinct HPC, AI, Deep Learning > kein Video-Ausgang Polaris, Fuji, Vega 10 §  Radeon Pro Multimedia, Engineering, Visualisierung Polaris, Vega 10 §  Radeon RX Gaming Polaris
  • 17. Komponenten, Begriffe, Architektur §  Shader §  SIMD — Single Instruction Multiple Data §  Streaming Multiprocessor, Next-Generation Compute Unit §  GPU-Memory: HBM2, GDDR §  Interconnects: NVLink, Infinity Fabric, PCIe
  • 18. Shader §  Programm, das einem Bildausschnitt bestimmte Eigenschaften zuweist §  Pixel Shader Farbe/Helligkeit für einen Bildpunkt §  Vertex Shader Raum-Koordinate (Vektor) ➛ 2D-Darstellung §  Geometry Shader Schatten, Überschneidungen, Verdeckungen §  Tesselation Shader komplexe Berechnungen für fotorealistische Ergebnisse
  • 19. Single Instruction Multiple Data — SIMD §  Differentialgleichungen Finite Elemente Methode §  Lösen von Gleichungssystemen für jeden Gitterknotenpunkt lineares Gleichungssystem §  überwiegend Matrizenmultiplikation
  • 20. Single Instruction Multiple Data — SIMD §  Matrizenmultiplikation §  Vektor-Arithmetik 1 2 3 4 5 6 7 8 2 4 6 8 × + 26 30 38 44 + 2 4 6 8 28 34 44 52 = = 1×5 + 3×7 2×5 + 4×7 1×6 + 3×8 2×6 + 4×8 2 4 6 8 + =
  • 21. Processing Units NVIDIA Volta Streaming Multiprocessor (SM) > 84 SM > 64 CUDA-Cores/SM > 8 Tensor-Cores/SM > 6048 Cores/Volta AMD Vega 10 Next-Generation Compute Unit (NCU) > 64 NCU > 64 Cores/NCU > 4096 Cores / Vega 10
  • 22. Processing Units — NVIDIA Volta
  • 24. Memory für GPUs §  Herausforderung: sehr viele Cores wollen Memoryzugriff §  Bottleneck: Speicherbandbreite §  GDDR5: 40 GB/s 5 Gbit/s/Pin @ 67 Data Pins §  HBM2: 256 GB/s NVIDIA Volta, Radeon Vega §  DDR4: 25.6 MB/s (!)
  • 25. Interconnects §  Anforderung: Multi-GPU-Systeme und Bandbreite zum CPU-Memory §  NVIDIA NVLink und NVLink 2 160 GB/s und 300 GB/s auch in IBM POWER8/9 verfügbar §  AMD Infinity Fabric Weiterentwicklung von HyperTransport max. 42.6 GB/s (aktuell) §  PCIe 4.0 1.9 GB/s je Lane (typ. x8 od. x16)
  • 26. Boston Grafikworkstation — Venom §  Intel Xeon Scalable Processor Family Intel Skylake §  NVIDIA Quadro (alle Karten) §  max. 768 GB DDR4 Memory §  2x M.2 NVMe SSD 10x SATA HDD-Slots
  • 27. Boston Mining Box §  Intel Broadwell-u §  9x Radeon RX470
  • 28. Boston Machine Learning Appliance §  custom built, je nach Anforderung §  z. B. Intel Broadwell-EP §  max. 24x 2.5“ SATA3 HDD §  8x NVIDIA GeForce GTX 1080 §  1 TB DDR4 ECC RAM §  vorinstalliert: Ubuntu/CenOS Linux, NVIDIA CUDA, TensorFlow Library, weitere DL/ML-Libraries und Frameworks nach Anforderung §  DL-Trainings, Support