SlideShare ist ein Scribd-Unternehmen logo
1 von 28
Downloaden Sie, um offline zu lesen
Boston Webinar
Machine Learning — Welche Rolle spielen GPUs?
Welche Anwendungsfälle gibt es?
Wolfgang Stief
Senior Consultant
§  Gegründet 1992 – 24 Jahre Innovation
§  Supermicros ältester & größter globaler Partner — seit über 20 Jahren
§  Lösungshersteller mit Fokus auf Technologie (First-to-Market Strategie)
§  London HQ, Niederlassungen in London City, München, Mumbai,
Bangalore, New York. Weitere Expansion geplant.
§  Experten im Lösungs- und HPC-System-Design unter Verwendung von
Premium-Komponenten von Supermicro und ausgewählten Partnern
§  Supermicros Fastest Growing Partner
Über uns
§  Was ist eigentlich Machine Learning?
Grundprinzipien, neuronale Netze, Algorithmen, Deep Learning, Historie
§  Anwendungsbeispiele für Machine Learning
Wo wird Machine Learning schon heute genutzt? Was bringt die Zukunft?
§  Hardware- und Software-Ökosystem
NVIDIA Tesla und Pascal, Supermicro ANNA, NVIDIA CUDA, Anwendungskatalog
Agenda
§  Nimm ein bisschen (gleichartige) Daten.
§  Trainiere ein (geeignetes mathematisches) Modell mit den Daten.
§  Benutze das trainierte Modell, um Vorhersagen auf neue Daten
zu machen.
Der Trainingsprozess ist (normalerweise) iterativ über viele
Schleifen mit Fehlerrückkopplung.
Was ist eigentlich Machine Learning?
§  Forschung zu AI/KI ab 1965
§  Convolutional Networks ab 1979
§  Fehlerrückkopplung seit 1960 als Prinzip, aber kaum genutzt
§  MNIST (1989) >> Handschriftenerkennung mit Fehlerrückkopplung
kommerzielle Nutzung: automatisiertes Lesen handgeschriebener Schecks (USA)
§  erst mit schnellen CPUs und ersten GPUs stellen kommen Erfolge
§  ImageNet (2012) — automatische Klassifizierung von Bildern
ab jetzt feature learning/deep learning anstatt feature engineering
§  ab 2012: Microsoft, Google, Facebook investiert (Startups, Research)
§  2015/2016: NVIDIA bringt Pascal/Tesla und Deep Learning Libraries
Geschichtliches
§  mehrere Layer Feature Learning
§  Auswahl per „Classifier“
> Neuron „feuert“
§  derzeit ca. 5-10 hidden layer
§  Convolutional Networks vs. LSTM
> Convolutional: Mustererkennung
> LSTM: Long Short-Term Memory
Zeitreihen über hunderte Zeitpunkte in die Vergangenheit
Deep Learning
§  so, wie auch Kinder lernen / das Gehirn lernt
deshalb auch „neuronales Netz“
§  mehrere (viele) Bilder/Muster einer einzelnen Sache
§  Fehlerrückkopplung
Einordnung über Wahrscheinlichkeiten
>> Entscheidung ja/nein
>> Schleifenparameter justieren
>> erneute Einordnung (Schleife)
Anlernen
§  komplex, viele Spielzüge/Möglichkeiten
§  Training mit Partien von Großmeistern
Spielbrett = Bild mit 19x19 Pixel
§  System spielt gegen sich selbst
Fehlerrückkopplung, Feinabstimmung
§  Trainiertes neuronales Netz + Monte Carlo Search Trees
Strategien, die für menschliche Spieler unmöglich oder unsinnig erscheinen, aber
hohe Gewinnwahrscheinlichkeit haben
§  Spezialgebiet schneller erlernbar, als Lebenszeit eines Menschen
ausreichen würde
Beispiel: AlphaGo (Google)
§  Vorlesung Deep Learning, Oxford University (Anfang 2015)
16x 50min
https://www.youtube.com/playlist?list=PLE6Wd9FR--EfW8dtjAuPoTuPcqmOV53Fu
§  Deep Learning in a Nutshell
4-teilge Artikel-Serie im NVIDIA Developer Blog
https://devblogs.nvidia.com/parallelforall/deep-learning-nutshell-core-concepts/
Wer Deep Learning genauer wissen will
§  IT Security
§  Advanced Persistent Threads
§  Zero-Days
Anwendungsbeispiele — Deep Instinct
§  Gensequenzen
Anwendungsbeispiele — Deep Genomics
§  Objekterkennung in Videos
§  Gesichts-/Personenerkennung
§  Wiedererkennung von Personen
§  Copyright Violation
Anwendungsbeispiele — NERVVE
§  Textanalyse wissenschaftlicher
Veröffentlichungen
§  Medikamentenforschung
Anwendungsbeispiele — Benevolent AI
§  Gesichtserkennung
§  Zutrittskontrolle
§  Überwachung
Anwendungsbeispiele — Smilart
§  Textanalyse
Sprache und Text
§  Zusammenfassungen
§  Copyright Violation
§  Information Security
(Datenlecks)
§  Beispiel/Demo:
https://www.gputechconf.eu/on-demand/
GTC Europe 2016 Keynote
Echtzeit Transcription
Anwendungsbeispiele — Intelligent Voice
§  automatisierte Mülltrennung
Roboter mit Mustererkennung
Anwendungsbeispiele — SADAKO
§  autonome Rennautos
Formel E
§  Stadtkurse, je 12 Runden
§  2016: Prototyp, Software
§  2017: sechs Teams mit je
zwei Autos
Anwendungsbeispiele — Roborace
Anwendungsbeispiele — Google Translate
“This inspired us to ask the following
question: Can we translate between a
language pair which the system has never
seen before? An example of this would be
translations between Korean and Japanese
where Korean ⇄ Japanese examples were
not shown to the system. Impressively, the
answer is yes — it can generate reasonable
Korean ⇄ Japanese translations, even
though it has never been taught to do so.”
https://research.googleblog.com/2016/11/zero-shot-translation-with-googles.html
Anwendungsbeispiele — Prisma / Artisto
PRISMA: Bilder — http://prisma-ai.com
Artisto: Videos — https://artisto.my.com
Kann jeder am Smartphone selbst probieren (iOS und Android).
§  autonomes Fahren
Lkw, Landmaschinen, Taxi, Pkw
§  Videoüberwachung
§  Data Leak Prevention
§  Deep Learning mit IoT
Killerapplikation?
Und in Zukunft?
§  ca. 3500 Cores, 1.328 GHz
§  15 Mrd. Transistoren
Intel Haswell: 1.4 Mrd. @ 18 Cores
§  10 TFLOPS @ FP32 (single, HPC)
5 TFLOPS @ FP64 (double, HPC)
21 TFLOPS @ FP16 (half, DL)
aktuelle Intel CPUs ca. 200..1000 GFLOPS
§  RDMA on Chip
GPU <> PCIe <> Target NIC
§  https://images.nvidia.com/content/pdf/tesla/whitepaper/pascal-architecture-
whitepaper.pdf
NVIDIA Pascal GPU — GP100
§  Accelerator Modul
Pascal GP100 + Memory
§  PCIe oder NVLink
§  12 GB oder 16 GB HBM2
High Bandwidth Memory 2
bis 720 GB/s Bandbreite, 4096 Connections
CoWoS — Chip on Wafer on Substrate
NVIDIA Tesla P100
§  GPU-to-GPU
max. 8 GPUs
§  GPU-to-CPU
derzeit POWER8 only
https://openpowerfoundation.org
§  je Link je Richtung 80 GB/s Bandwidth
PCIe ca. 1 GB/s je Lane
PCIe x16 = 16 GB/s max.
NVLink
§  Deep Learning Appliance
1 HE, 2x Intel Xeon, 3 TB RAM max.
4x Tesla P100 NVLink
2x 2.5“ intern + 2x 2.5“ Hot Swap
4x PCIe (3x x8, 1x x16)
§  85 TFLOPS peak (FP16)
“delivers same model within days
versus weeks with CPUs“
§  demnächst: 8x P100 mit NVLink
2 HE vs. 3 HE NVIDIA DGX-1
10 GBE vs. 1 GBE only NVIDIA DGX-1
§  bald: alternative HW-Architektur, P100 mit GPU-to-CPU NVLink
Boston ANNA Pascal
§  verschiedene Boards und Chassis
Tesla P100 auch als PCIe-Variante verfügbar
bis max. acht P100 GPUs (PCIe based, 4 HE)
Supermicro Server
					
>> beim zuständigen Kollegen im Vertrieb nachfragen
§  NVIDIA CUDA 8
Development, Libraries
§  NVIDIA Deep Learning SDK
unterstützt alle üblichen Deep Learning Frameworks
- cuDNN — Deep Learning Primitives
- TensorRT — Deep Learning Inference Engine
- DeepStream SDK — Deep Learning for Video Analytics
- cuBLAS — Linear Algebra
- cuSPARSE — Sparse Matrix Operations
- NCCL — Multi-GPU Communication
§  https://developer.nvidia.com/deep-learning-software
https://www.nvidia.com/content/gpu-applications/PDF/gpu-applications-catalog.pdf
Software für P100 und Deep Learning
GPU zum Ausprobieren
					
> Fragen Sie ihren Ansprechpartner bei Boston
sales@boston-it.de
> vScaler GPU Cloud
Kontakt
+49 89 9090199-3
www.boston-itsolutions.de
sales@boston-it.de
BostonITsolutions
@BostonGermany
Boston-server-&-storage-solutions-gmbh

Weitere ähnliche Inhalte

Andere mochten auch

The Who Cares Test - Archestra Value Mapper
 The Who Cares Test - Archestra Value Mapper   The Who Cares Test - Archestra Value Mapper
The Who Cares Test - Archestra Value Mapper Malcolm Ryder
 
Influencer Campaigns That Don't Suck A How-To Guide
Influencer Campaigns That Don't Suck A How-To GuideInfluencer Campaigns That Don't Suck A How-To Guide
Influencer Campaigns That Don't Suck A How-To GuideAffiliate Summit
 
8002 Research Project Faciltator Manual
8002 Research Project Faciltator Manual8002 Research Project Faciltator Manual
8002 Research Project Faciltator ManualJay Hays
 
How Dell Delivers Personalized Customer Experiences, Leveraging Digital Commu...
How Dell Delivers Personalized Customer Experiences, Leveraging Digital Commu...How Dell Delivers Personalized Customer Experiences, Leveraging Digital Commu...
How Dell Delivers Personalized Customer Experiences, Leveraging Digital Commu...Moxie
 
Keynote: The Journey to Pervasive Analytics
Keynote: The Journey to Pervasive AnalyticsKeynote: The Journey to Pervasive Analytics
Keynote: The Journey to Pervasive AnalyticsCloudera, Inc.
 
Data: Open for Good and Secure by Default | Eddie Garcia
Data: Open for Good and Secure by Default | Eddie GarciaData: Open for Good and Secure by Default | Eddie Garcia
Data: Open for Good and Secure by Default | Eddie GarciaCloudera, Inc.
 
1 resistant hypertension
1 resistant hypertension1 resistant hypertension
1 resistant hypertensionthozie02
 
Tech Backpack Brief v1
Tech Backpack Brief v1Tech Backpack Brief v1
Tech Backpack Brief v1Tech Backpack
 
INTERNAL MEDICINE - Secondary Hypertension
INTERNAL MEDICINE - Secondary HypertensionINTERNAL MEDICINE - Secondary Hypertension
INTERNAL MEDICINE - Secondary HypertensionNian Baring
 

Andere mochten auch (11)

The Who Cares Test - Archestra Value Mapper
 The Who Cares Test - Archestra Value Mapper   The Who Cares Test - Archestra Value Mapper
The Who Cares Test - Archestra Value Mapper
 
Influencer Campaigns That Don't Suck A How-To Guide
Influencer Campaigns That Don't Suck A How-To GuideInfluencer Campaigns That Don't Suck A How-To Guide
Influencer Campaigns That Don't Suck A How-To Guide
 
8002 Research Project Faciltator Manual
8002 Research Project Faciltator Manual8002 Research Project Faciltator Manual
8002 Research Project Faciltator Manual
 
How Dell Delivers Personalized Customer Experiences, Leveraging Digital Commu...
How Dell Delivers Personalized Customer Experiences, Leveraging Digital Commu...How Dell Delivers Personalized Customer Experiences, Leveraging Digital Commu...
How Dell Delivers Personalized Customer Experiences, Leveraging Digital Commu...
 
Cerner ppt
Cerner pptCerner ppt
Cerner ppt
 
Keynote: The Journey to Pervasive Analytics
Keynote: The Journey to Pervasive AnalyticsKeynote: The Journey to Pervasive Analytics
Keynote: The Journey to Pervasive Analytics
 
Data: Open for Good and Secure by Default | Eddie Garcia
Data: Open for Good and Secure by Default | Eddie GarciaData: Open for Good and Secure by Default | Eddie Garcia
Data: Open for Good and Secure by Default | Eddie Garcia
 
1 resistant hypertension
1 resistant hypertension1 resistant hypertension
1 resistant hypertension
 
Tech Backpack Brief v1
Tech Backpack Brief v1Tech Backpack Brief v1
Tech Backpack Brief v1
 
INTERNAL MEDICINE - Secondary Hypertension
INTERNAL MEDICINE - Secondary HypertensionINTERNAL MEDICINE - Secondary Hypertension
INTERNAL MEDICINE - Secondary Hypertension
 
Malignant hypertension
Malignant hypertensionMalignant hypertension
Malignant hypertension
 

Ähnlich wie Boston webcast gpu_2016-12

Expert system webinar 29.6.2017 cogito und deep learning
Expert system webinar  29.6.2017   cogito und deep learningExpert system webinar  29.6.2017   cogito und deep learning
Expert system webinar 29.6.2017 cogito und deep learningStefan Geißler
 
Erasure coding stief.tech 2020-03
Erasure coding stief.tech 2020-03Erasure coding stief.tech 2020-03
Erasure coding stief.tech 2020-03data://disrupted®
 
Tipps & Tricks für den erfolgreichen Einsatz von GPU-Computing
Tipps & Tricks für den erfolgreichen Einsatz von GPU-ComputingTipps & Tricks für den erfolgreichen Einsatz von GPU-Computing
Tipps & Tricks für den erfolgreichen Einsatz von GPU-ComputingJörn Dinkla
 
Multi-GPU-Computing: Eins, zwei, drei, ganz viele
Multi-GPU-Computing: Eins, zwei, drei, ganz vieleMulti-GPU-Computing: Eins, zwei, drei, ganz viele
Multi-GPU-Computing: Eins, zwei, drei, ganz vieleJörn Dinkla
 
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDA
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDASchulung: Einführung in das GPU-Computing mit NVIDIA CUDA
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDAJörn Dinkla
 
High performance mit PHP
High performance mit PHPHigh performance mit PHP
High performance mit PHPThomas Burgard
 
Microservices and Container Management with Mesosphere DC/OS
Microservices and Container Management with Mesosphere DC/OSMicroservices and Container Management with Mesosphere DC/OS
Microservices and Container Management with Mesosphere DC/OSRalf Ernst
 
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)nwilbert
 
Hochleistungsspeichersysteme für Datenanalyse an der TU Dresden (Michael Kluge)
Hochleistungsspeichersysteme für Datenanalyse an der TU Dresden (Michael Kluge)Hochleistungsspeichersysteme für Datenanalyse an der TU Dresden (Michael Kluge)
Hochleistungsspeichersysteme für Datenanalyse an der TU Dresden (Michael Kluge)data://disrupted®
 
DOAG 2018 / Praktische Erfahrungen mit SPARC S7-2 Server
DOAG 2018 / Praktische Erfahrungen mit SPARC S7-2 ServerDOAG 2018 / Praktische Erfahrungen mit SPARC S7-2 Server
DOAG 2018 / Praktische Erfahrungen mit SPARC S7-2 ServerJomaSoft
 
Puppet: Designing modules & repositories
Puppet: Designing modules & repositoriesPuppet: Designing modules & repositories
Puppet: Designing modules & repositoriesinovex GmbH
 
FROSCON 2011: MySQL Performance Tuning
FROSCON 2011: MySQL Performance TuningFROSCON 2011: MySQL Performance Tuning
FROSCON 2011: MySQL Performance TuningFromDual GmbH
 
OSMC 2011 | Monitoring at large - die Welt ist nicht genug by Thomas Gelf
OSMC 2011 | Monitoring at large - die Welt ist nicht genug by Thomas GelfOSMC 2011 | Monitoring at large - die Welt ist nicht genug by Thomas Gelf
OSMC 2011 | Monitoring at large - die Welt ist nicht genug by Thomas GelfNETWAYS
 
DOAG 2011: MySQL Performance Tuning
DOAG 2011: MySQL Performance TuningDOAG 2011: MySQL Performance Tuning
DOAG 2011: MySQL Performance TuningFromDual GmbH
 

Ähnlich wie Boston webcast gpu_2016-12 (20)

Expert system webinar 29.6.2017 cogito und deep learning
Expert system webinar  29.6.2017   cogito und deep learningExpert system webinar  29.6.2017   cogito und deep learning
Expert system webinar 29.6.2017 cogito und deep learning
 
CPU Update Juni 2017
CPU Update Juni 2017CPU Update Juni 2017
CPU Update Juni 2017
 
GPUs — Vom spezialisierten Coprozessor zum Numbercruncher
GPUs — Vom spezialisierten Coprozessor zum NumbercruncherGPUs — Vom spezialisierten Coprozessor zum Numbercruncher
GPUs — Vom spezialisierten Coprozessor zum Numbercruncher
 
Erasure coding stief.tech 2020-03
Erasure coding stief.tech 2020-03Erasure coding stief.tech 2020-03
Erasure coding stief.tech 2020-03
 
Tipps & Tricks für den erfolgreichen Einsatz von GPU-Computing
Tipps & Tricks für den erfolgreichen Einsatz von GPU-ComputingTipps & Tricks für den erfolgreichen Einsatz von GPU-Computing
Tipps & Tricks für den erfolgreichen Einsatz von GPU-Computing
 
Multi-GPU-Computing: Eins, zwei, drei, ganz viele
Multi-GPU-Computing: Eins, zwei, drei, ganz vieleMulti-GPU-Computing: Eins, zwei, drei, ganz viele
Multi-GPU-Computing: Eins, zwei, drei, ganz viele
 
Boston webcast nv_me_2016-09
Boston webcast nv_me_2016-09Boston webcast nv_me_2016-09
Boston webcast nv_me_2016-09
 
Frameworks und Prozessoren
Frameworks und ProzessorenFrameworks und Prozessoren
Frameworks und Prozessoren
 
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDA
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDASchulung: Einführung in das GPU-Computing mit NVIDIA CUDA
Schulung: Einführung in das GPU-Computing mit NVIDIA CUDA
 
High performance mit PHP
High performance mit PHPHigh performance mit PHP
High performance mit PHP
 
Microservices and Container Management with Mesosphere DC/OS
Microservices and Container Management with Mesosphere DC/OSMicroservices and Container Management with Mesosphere DC/OS
Microservices and Container Management with Mesosphere DC/OS
 
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)
 
Hochleistungsspeichersysteme für Datenanalyse an der TU Dresden (Michael Kluge)
Hochleistungsspeichersysteme für Datenanalyse an der TU Dresden (Michael Kluge)Hochleistungsspeichersysteme für Datenanalyse an der TU Dresden (Michael Kluge)
Hochleistungsspeichersysteme für Datenanalyse an der TU Dresden (Michael Kluge)
 
Performancemessung, jetzt in echt
Performancemessung, jetzt in echtPerformancemessung, jetzt in echt
Performancemessung, jetzt in echt
 
DOAG 2018 / Praktische Erfahrungen mit SPARC S7-2 Server
DOAG 2018 / Praktische Erfahrungen mit SPARC S7-2 ServerDOAG 2018 / Praktische Erfahrungen mit SPARC S7-2 Server
DOAG 2018 / Praktische Erfahrungen mit SPARC S7-2 Server
 
Puppet: Designing modules & repositories
Puppet: Designing modules & repositoriesPuppet: Designing modules & repositories
Puppet: Designing modules & repositories
 
FROSCON 2011: MySQL Performance Tuning
FROSCON 2011: MySQL Performance TuningFROSCON 2011: MySQL Performance Tuning
FROSCON 2011: MySQL Performance Tuning
 
OSMC 2011 | Monitoring at large - die Welt ist nicht genug by Thomas Gelf
OSMC 2011 | Monitoring at large - die Welt ist nicht genug by Thomas GelfOSMC 2011 | Monitoring at large - die Welt ist nicht genug by Thomas Gelf
OSMC 2011 | Monitoring at large - die Welt ist nicht genug by Thomas Gelf
 
DOAG 2011: MySQL Performance Tuning
DOAG 2011: MySQL Performance TuningDOAG 2011: MySQL Performance Tuning
DOAG 2011: MySQL Performance Tuning
 
[DE] PROJECT CONSULT Newsletter 2017 (Part 2/3) | PROJECT CONSULT Unternehmen...
[DE] PROJECT CONSULT Newsletter 2017 (Part 2/3) | PROJECT CONSULT Unternehmen...[DE] PROJECT CONSULT Newsletter 2017 (Part 2/3) | PROJECT CONSULT Unternehmen...
[DE] PROJECT CONSULT Newsletter 2017 (Part 2/3) | PROJECT CONSULT Unternehmen...
 

Mehr von BOSTON Server & Storage Solutions GmbH

Seagate – Next Level Storage (Webinar mit Boston Server & Storage, 2018 09-28)
Seagate – Next Level Storage (Webinar mit Boston Server & Storage,  2018 09-28)Seagate – Next Level Storage (Webinar mit Boston Server & Storage,  2018 09-28)
Seagate – Next Level Storage (Webinar mit Boston Server & Storage, 2018 09-28)BOSTON Server & Storage Solutions GmbH
 
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...BOSTON Server & Storage Solutions GmbH
 
Datera — Elastic Data Fabric Storage für das Rechenzentrum von heute
Datera — Elastic Data Fabric Storage für das Rechenzentrum von heuteDatera — Elastic Data Fabric Storage für das Rechenzentrum von heute
Datera — Elastic Data Fabric Storage für das Rechenzentrum von heuteBOSTON Server & Storage Solutions GmbH
 
Webinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap Technology
Webinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap TechnologyWebinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap Technology
Webinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap TechnologyBOSTON Server & Storage Solutions GmbH
 

Mehr von BOSTON Server & Storage Solutions GmbH (10)

Storage, Backup und Business Continuity mit Open-E
Storage, Backup und Business Continuity mit Open-EStorage, Backup und Business Continuity mit Open-E
Storage, Backup und Business Continuity mit Open-E
 
Seagate – Next Level Storage (Webinar mit Boston Server & Storage, 2018 09-28)
Seagate – Next Level Storage (Webinar mit Boston Server & Storage,  2018 09-28)Seagate – Next Level Storage (Webinar mit Boston Server & Storage,  2018 09-28)
Seagate – Next Level Storage (Webinar mit Boston Server & Storage, 2018 09-28)
 
Welcome to the Datasphere – the next level of storage
Welcome to the Datasphere – the next level of storageWelcome to the Datasphere – the next level of storage
Welcome to the Datasphere – the next level of storage
 
SuperSUSE – die Lösung für dynamisch wachsenden Speicher
SuperSUSE – die Lösung für dynamisch wachsenden SpeicherSuperSUSE – die Lösung für dynamisch wachsenden Speicher
SuperSUSE – die Lösung für dynamisch wachsenden Speicher
 
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
 
Was genau macht eigentlich Erasure Coding, und wozu braucht man das?
Was genau macht eigentlich Erasure Coding, und wozu braucht man das?Was genau macht eigentlich Erasure Coding, und wozu braucht man das?
Was genau macht eigentlich Erasure Coding, und wozu braucht man das?
 
Datera — Elastic Data Fabric Storage für das Rechenzentrum von heute
Datera — Elastic Data Fabric Storage für das Rechenzentrum von heuteDatera — Elastic Data Fabric Storage für das Rechenzentrum von heute
Datera — Elastic Data Fabric Storage für das Rechenzentrum von heute
 
Webinar: Boston Igloo Plus mit AccelStor FlexiRemap Technologie
Webinar: Boston Igloo Plus mit AccelStor FlexiRemap TechnologieWebinar: Boston Igloo Plus mit AccelStor FlexiRemap Technologie
Webinar: Boston Igloo Plus mit AccelStor FlexiRemap Technologie
 
Webinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap Technology
Webinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap TechnologyWebinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap Technology
Webinar Boston Igloo Plus All-Flash-Array mit AccelStor FlexiRemap Technology
 
Boston webcast hyperconverged_2016-06
Boston webcast hyperconverged_2016-06Boston webcast hyperconverged_2016-06
Boston webcast hyperconverged_2016-06
 

Boston webcast gpu_2016-12

  • 1. Boston Webinar Machine Learning — Welche Rolle spielen GPUs? Welche Anwendungsfälle gibt es? Wolfgang Stief Senior Consultant
  • 2. §  Gegründet 1992 – 24 Jahre Innovation §  Supermicros ältester & größter globaler Partner — seit über 20 Jahren §  Lösungshersteller mit Fokus auf Technologie (First-to-Market Strategie) §  London HQ, Niederlassungen in London City, München, Mumbai, Bangalore, New York. Weitere Expansion geplant. §  Experten im Lösungs- und HPC-System-Design unter Verwendung von Premium-Komponenten von Supermicro und ausgewählten Partnern §  Supermicros Fastest Growing Partner Über uns
  • 3. §  Was ist eigentlich Machine Learning? Grundprinzipien, neuronale Netze, Algorithmen, Deep Learning, Historie §  Anwendungsbeispiele für Machine Learning Wo wird Machine Learning schon heute genutzt? Was bringt die Zukunft? §  Hardware- und Software-Ökosystem NVIDIA Tesla und Pascal, Supermicro ANNA, NVIDIA CUDA, Anwendungskatalog Agenda
  • 4. §  Nimm ein bisschen (gleichartige) Daten. §  Trainiere ein (geeignetes mathematisches) Modell mit den Daten. §  Benutze das trainierte Modell, um Vorhersagen auf neue Daten zu machen. Der Trainingsprozess ist (normalerweise) iterativ über viele Schleifen mit Fehlerrückkopplung. Was ist eigentlich Machine Learning?
  • 5. §  Forschung zu AI/KI ab 1965 §  Convolutional Networks ab 1979 §  Fehlerrückkopplung seit 1960 als Prinzip, aber kaum genutzt §  MNIST (1989) >> Handschriftenerkennung mit Fehlerrückkopplung kommerzielle Nutzung: automatisiertes Lesen handgeschriebener Schecks (USA) §  erst mit schnellen CPUs und ersten GPUs stellen kommen Erfolge §  ImageNet (2012) — automatische Klassifizierung von Bildern ab jetzt feature learning/deep learning anstatt feature engineering §  ab 2012: Microsoft, Google, Facebook investiert (Startups, Research) §  2015/2016: NVIDIA bringt Pascal/Tesla und Deep Learning Libraries Geschichtliches
  • 6. §  mehrere Layer Feature Learning §  Auswahl per „Classifier“ > Neuron „feuert“ §  derzeit ca. 5-10 hidden layer §  Convolutional Networks vs. LSTM > Convolutional: Mustererkennung > LSTM: Long Short-Term Memory Zeitreihen über hunderte Zeitpunkte in die Vergangenheit Deep Learning
  • 7. §  so, wie auch Kinder lernen / das Gehirn lernt deshalb auch „neuronales Netz“ §  mehrere (viele) Bilder/Muster einer einzelnen Sache §  Fehlerrückkopplung Einordnung über Wahrscheinlichkeiten >> Entscheidung ja/nein >> Schleifenparameter justieren >> erneute Einordnung (Schleife) Anlernen
  • 8. §  komplex, viele Spielzüge/Möglichkeiten §  Training mit Partien von Großmeistern Spielbrett = Bild mit 19x19 Pixel §  System spielt gegen sich selbst Fehlerrückkopplung, Feinabstimmung §  Trainiertes neuronales Netz + Monte Carlo Search Trees Strategien, die für menschliche Spieler unmöglich oder unsinnig erscheinen, aber hohe Gewinnwahrscheinlichkeit haben §  Spezialgebiet schneller erlernbar, als Lebenszeit eines Menschen ausreichen würde Beispiel: AlphaGo (Google)
  • 9. §  Vorlesung Deep Learning, Oxford University (Anfang 2015) 16x 50min https://www.youtube.com/playlist?list=PLE6Wd9FR--EfW8dtjAuPoTuPcqmOV53Fu §  Deep Learning in a Nutshell 4-teilge Artikel-Serie im NVIDIA Developer Blog https://devblogs.nvidia.com/parallelforall/deep-learning-nutshell-core-concepts/ Wer Deep Learning genauer wissen will
  • 10. §  IT Security §  Advanced Persistent Threads §  Zero-Days Anwendungsbeispiele — Deep Instinct
  • 12. §  Objekterkennung in Videos §  Gesichts-/Personenerkennung §  Wiedererkennung von Personen §  Copyright Violation Anwendungsbeispiele — NERVVE
  • 13. §  Textanalyse wissenschaftlicher Veröffentlichungen §  Medikamentenforschung Anwendungsbeispiele — Benevolent AI
  • 14. §  Gesichtserkennung §  Zutrittskontrolle §  Überwachung Anwendungsbeispiele — Smilart
  • 15. §  Textanalyse Sprache und Text §  Zusammenfassungen §  Copyright Violation §  Information Security (Datenlecks) §  Beispiel/Demo: https://www.gputechconf.eu/on-demand/ GTC Europe 2016 Keynote Echtzeit Transcription Anwendungsbeispiele — Intelligent Voice
  • 16. §  automatisierte Mülltrennung Roboter mit Mustererkennung Anwendungsbeispiele — SADAKO
  • 17. §  autonome Rennautos Formel E §  Stadtkurse, je 12 Runden §  2016: Prototyp, Software §  2017: sechs Teams mit je zwei Autos Anwendungsbeispiele — Roborace
  • 18. Anwendungsbeispiele — Google Translate “This inspired us to ask the following question: Can we translate between a language pair which the system has never seen before? An example of this would be translations between Korean and Japanese where Korean ⇄ Japanese examples were not shown to the system. Impressively, the answer is yes — it can generate reasonable Korean ⇄ Japanese translations, even though it has never been taught to do so.” https://research.googleblog.com/2016/11/zero-shot-translation-with-googles.html
  • 19. Anwendungsbeispiele — Prisma / Artisto PRISMA: Bilder — http://prisma-ai.com Artisto: Videos — https://artisto.my.com Kann jeder am Smartphone selbst probieren (iOS und Android).
  • 20. §  autonomes Fahren Lkw, Landmaschinen, Taxi, Pkw §  Videoüberwachung §  Data Leak Prevention §  Deep Learning mit IoT Killerapplikation? Und in Zukunft?
  • 21. §  ca. 3500 Cores, 1.328 GHz §  15 Mrd. Transistoren Intel Haswell: 1.4 Mrd. @ 18 Cores §  10 TFLOPS @ FP32 (single, HPC) 5 TFLOPS @ FP64 (double, HPC) 21 TFLOPS @ FP16 (half, DL) aktuelle Intel CPUs ca. 200..1000 GFLOPS §  RDMA on Chip GPU <> PCIe <> Target NIC §  https://images.nvidia.com/content/pdf/tesla/whitepaper/pascal-architecture- whitepaper.pdf NVIDIA Pascal GPU — GP100
  • 22. §  Accelerator Modul Pascal GP100 + Memory §  PCIe oder NVLink §  12 GB oder 16 GB HBM2 High Bandwidth Memory 2 bis 720 GB/s Bandbreite, 4096 Connections CoWoS — Chip on Wafer on Substrate NVIDIA Tesla P100
  • 23. §  GPU-to-GPU max. 8 GPUs §  GPU-to-CPU derzeit POWER8 only https://openpowerfoundation.org §  je Link je Richtung 80 GB/s Bandwidth PCIe ca. 1 GB/s je Lane PCIe x16 = 16 GB/s max. NVLink
  • 24. §  Deep Learning Appliance 1 HE, 2x Intel Xeon, 3 TB RAM max. 4x Tesla P100 NVLink 2x 2.5“ intern + 2x 2.5“ Hot Swap 4x PCIe (3x x8, 1x x16) §  85 TFLOPS peak (FP16) “delivers same model within days versus weeks with CPUs“ §  demnächst: 8x P100 mit NVLink 2 HE vs. 3 HE NVIDIA DGX-1 10 GBE vs. 1 GBE only NVIDIA DGX-1 §  bald: alternative HW-Architektur, P100 mit GPU-to-CPU NVLink Boston ANNA Pascal
  • 25. §  verschiedene Boards und Chassis Tesla P100 auch als PCIe-Variante verfügbar bis max. acht P100 GPUs (PCIe based, 4 HE) Supermicro Server >> beim zuständigen Kollegen im Vertrieb nachfragen
  • 26. §  NVIDIA CUDA 8 Development, Libraries §  NVIDIA Deep Learning SDK unterstützt alle üblichen Deep Learning Frameworks - cuDNN — Deep Learning Primitives - TensorRT — Deep Learning Inference Engine - DeepStream SDK — Deep Learning for Video Analytics - cuBLAS — Linear Algebra - cuSPARSE — Sparse Matrix Operations - NCCL — Multi-GPU Communication §  https://developer.nvidia.com/deep-learning-software https://www.nvidia.com/content/gpu-applications/PDF/gpu-applications-catalog.pdf Software für P100 und Deep Learning
  • 27. GPU zum Ausprobieren > Fragen Sie ihren Ansprechpartner bei Boston sales@boston-it.de > vScaler GPU Cloud