SlideShare ist ein Scribd-Unternehmen logo
1 von 16
Ervaring met parallel computing van Cuda Kasper Van Remoortere Nils Lamot 1ste Bachelor Informatica
Inhoudstafel Situatieschets GeForce 8800 Programmeertaal: CUDA Architectuur: Tesla Applicatie voorbeeld Conclusies 2 Kasper Van Remoortere  -  Nils Lamot
Situatieschets Kloksnelheid verhogen Parallel geschakelde processors Efficiënt gebruik? GPU’s al langer parallel  real-timegraphics 3 Kasper Van Remoortere  -  Nils Lamot
Tesla architectuur Rechtstreeks programmeerbare GPU’s CUDA programmeermodel  (= extensie van C) Makkelijk voor programmeurs Versnelt het rekenproces 4 GeForce 8800 Kasper Van Remoortere  -  Nils Lamot
Programmeertaal - CUDA Programmeeromgeving van Nvidia Doelen: Uitbreiding C/C++  uitdrukking parallellisme vereenvoudigen Code goed verdelen over threads Vb.: Huidige GPU’s - 30 720 threads 5 Kasper Van Remoortere  -  Nils Lamot
Programmeertaal - onderdelen 6 Rooster van blokken Parallelle Threads
Programmeertaal - geheugen 7 HS gedeeld geheugen Data-parallel > Task-parallel Globaal geheugen
Architectuur - Tesla Doel: programma’s in CUDA optimaal uitvoeren Aanmaak, planning, resource management  In hardware opgenomen Tijd creëren/verwijderen = verwaarloosbaar Geoptimaliseerd in het verwerken  van opeenvolgende, gelijkende patronen 8 Kasper Van Remoortere  -  Nils Lamot
9 Architectuur - structuur SM Multi-threaded Processor ,[object Object]
SIMT: blok thread = warp van 32 threads SP cores: toegang tot assortiment instructies Multithreading:  grote cache overbodig Kasper Van Remoortere  -  Nils Lamot
Applicaties Moleculaire bewegingen Numerieke lineaire algebra Medische sector Beweging van vloeistoffen Seismologie  10
Applicatie – Numerieke lineaire algebraMatrixvermenigvuldiging Berekeningen verdeelbaar in blokken 11 Hoe matrices vermenigvuldigen: A x B = C a1,1 x b1,1 + a1,2 x b2,1 +… = c1,1 Kasper Van Remoortere  -  Nils Lamot
12 Applicatie – Numerieke lineaire algebraAlgoritme Volkov en Demmel  vs. MKL Kasper Van Remoortere  -  Nils Lamot
Applicatie – Numerieke lineaire algebraVerklaring snelheid algoritme V&D Data-blocks opgeslagen in GPU-registersregister = groot  tijdelijke opslag berekeningen Blokken elementen /thread  1/thread Software prefetching wachttijd geheugen  13 Kasper Van Remoortere  -  Nils Lamot
Applicatie – Numerieke lineaire algebraMatrix factorisatie Matrix naar eenvoudigste vorm omzetten Oplossen stelsels Factorisatiemethodes:  LU  Cholesky QR factorisatie 14 Kasper Van Remoortere  -  Nils Lamot
15 Kasper Van Remoortere  -  Nils Lamot

Weitere ähnliche Inhalte

Ähnlich wie Ervaring met parallel computing van Cuda

The future of Web-Scale - Johan Tillema, Rene Boere & Chris Quach
The future of Web-Scale - Johan Tillema, Rene Boere & Chris QuachThe future of Web-Scale - Johan Tillema, Rene Boere & Chris Quach
The future of Web-Scale - Johan Tillema, Rene Boere & Chris QuachNLJUG
 
PhD presentation
PhD presentationPhD presentation
PhD presentationWim Heirman
 
BA Netapp Event - Always there IT Infrastructuur
BA Netapp Event - Always there IT InfrastructuurBA Netapp Event - Always there IT Infrastructuur
BA Netapp Event - Always there IT InfrastructuurB.A.
 
Lezing 23 November 2006 @ CapGemini
Lezing 23 November 2006 @  CapGeminiLezing 23 November 2006 @  CapGemini
Lezing 23 November 2006 @ CapGeminijaspervandermarel
 
ARM Your Green Cloud for Big Data (Cy7 ARM Server Introduction BeNeLux Q4 2014)
ARM Your Green Cloud for Big Data (Cy7 ARM Server Introduction BeNeLux Q4 2014)ARM Your Green Cloud for Big Data (Cy7 ARM Server Introduction BeNeLux Q4 2014)
ARM Your Green Cloud for Big Data (Cy7 ARM Server Introduction BeNeLux Q4 2014)Compatibles2 BV
 
Tussentijdse thesispresentatie 28 01
Tussentijdse thesispresentatie 28 01Tussentijdse thesispresentatie 28 01
Tussentijdse thesispresentatie 28 01WouterDillen
 
Profiel thymos rudi respen
Profiel thymos   rudi respenProfiel thymos   rudi respen
Profiel thymos rudi respenRudi Respen
 
[Idm h] computers, netwerken, it architectuur 2
[Idm h] computers, netwerken, it architectuur 2[Idm h] computers, netwerken, it architectuur 2
[Idm h] computers, netwerken, it architectuur 2Klaas Jan Mollema
 
PSM security management - keeps getting better
PSM security management - keeps getting betterPSM security management - keeps getting better
PSM security management - keeps getting betterGET Time & Security
 
Alle voordelen van FlexPod en EMC VSPEX converged infrastructuren op een rij
Alle voordelen van FlexPod en EMC VSPEX converged infrastructuren op een rijAlle voordelen van FlexPod en EMC VSPEX converged infrastructuren op een rij
Alle voordelen van FlexPod en EMC VSPEX converged infrastructuren op een rijProact Netherlands B.V.
 
How do you move a supercomputer?
How do you move a supercomputer?How do you move a supercomputer?
How do you move a supercomputer?Robert Lukkenaer
 
Mechatronic System Design
Mechatronic System DesignMechatronic System Design
Mechatronic System DesignVincent Claes
 
DSD-NL 2018 Roosterontwikkeling in D-HYDRO - Tiessen
DSD-NL 2018 Roosterontwikkeling in D-HYDRO - TiessenDSD-NL 2018 Roosterontwikkeling in D-HYDRO - Tiessen
DSD-NL 2018 Roosterontwikkeling in D-HYDRO - TiessenDeltares
 
2015 01-15.exception twente.ruud jeurissen
2015 01-15.exception twente.ruud jeurissen2015 01-15.exception twente.ruud jeurissen
2015 01-15.exception twente.ruud jeurissenNiek Schmoller
 

Ähnlich wie Ervaring met parallel computing van Cuda (20)

The future of Web-Scale - Johan Tillema, Rene Boere & Chris Quach
The future of Web-Scale - Johan Tillema, Rene Boere & Chris QuachThe future of Web-Scale - Johan Tillema, Rene Boere & Chris Quach
The future of Web-Scale - Johan Tillema, Rene Boere & Chris Quach
 
Cv
CvCv
Cv
 
PhD presentation
PhD presentationPhD presentation
PhD presentation
 
BA Netapp Event - Always there IT Infrastructuur
BA Netapp Event - Always there IT InfrastructuurBA Netapp Event - Always there IT Infrastructuur
BA Netapp Event - Always there IT Infrastructuur
 
Lezing 23 November 2006 @ CapGemini
Lezing 23 November 2006 @  CapGeminiLezing 23 November 2006 @  CapGemini
Lezing 23 November 2006 @ CapGemini
 
ARM Your Green Cloud for Big Data (Cy7 ARM Server Introduction BeNeLux Q4 2014)
ARM Your Green Cloud for Big Data (Cy7 ARM Server Introduction BeNeLux Q4 2014)ARM Your Green Cloud for Big Data (Cy7 ARM Server Introduction BeNeLux Q4 2014)
ARM Your Green Cloud for Big Data (Cy7 ARM Server Introduction BeNeLux Q4 2014)
 
Tussentijdse thesispresentatie 28 01
Tussentijdse thesispresentatie 28 01Tussentijdse thesispresentatie 28 01
Tussentijdse thesispresentatie 28 01
 
Profiel thymos rudi respen
Profiel thymos   rudi respenProfiel thymos   rudi respen
Profiel thymos rudi respen
 
Isw Programmeren
Isw ProgrammerenIsw Programmeren
Isw Programmeren
 
[Idm h] computers, netwerken, it architectuur 2
[Idm h] computers, netwerken, it architectuur 2[Idm h] computers, netwerken, it architectuur 2
[Idm h] computers, netwerken, it architectuur 2
 
PSM security management - keeps getting better
PSM security management - keeps getting betterPSM security management - keeps getting better
PSM security management - keeps getting better
 
Netflow Performance
Netflow PerformanceNetflow Performance
Netflow Performance
 
Alle voordelen van FlexPod en EMC VSPEX converged infrastructuren op een rij
Alle voordelen van FlexPod en EMC VSPEX converged infrastructuren op een rijAlle voordelen van FlexPod en EMC VSPEX converged infrastructuren op een rij
Alle voordelen van FlexPod en EMC VSPEX converged infrastructuren op een rij
 
How do you move a supercomputer?
How do you move a supercomputer?How do you move a supercomputer?
How do you move a supercomputer?
 
De processor
De processorDe processor
De processor
 
Mechatronic System Design
Mechatronic System DesignMechatronic System Design
Mechatronic System Design
 
DSD-NL 2018 Roosterontwikkeling in D-HYDRO - Tiessen
DSD-NL 2018 Roosterontwikkeling in D-HYDRO - TiessenDSD-NL 2018 Roosterontwikkeling in D-HYDRO - Tiessen
DSD-NL 2018 Roosterontwikkeling in D-HYDRO - Tiessen
 
Dvbshop
DvbshopDvbshop
Dvbshop
 
2015 01-15.exception twente.ruud jeurissen
2015 01-15.exception twente.ruud jeurissen2015 01-15.exception twente.ruud jeurissen
2015 01-15.exception twente.ruud jeurissen
 
Thesis Demo Hls 09
Thesis Demo Hls 09Thesis Demo Hls 09
Thesis Demo Hls 09
 

Ervaring met parallel computing van Cuda

  • 1. Ervaring met parallel computing van Cuda Kasper Van Remoortere Nils Lamot 1ste Bachelor Informatica
  • 2. Inhoudstafel Situatieschets GeForce 8800 Programmeertaal: CUDA Architectuur: Tesla Applicatie voorbeeld Conclusies 2 Kasper Van Remoortere - Nils Lamot
  • 3. Situatieschets Kloksnelheid verhogen Parallel geschakelde processors Efficiënt gebruik? GPU’s al langer parallel  real-timegraphics 3 Kasper Van Remoortere - Nils Lamot
  • 4. Tesla architectuur Rechtstreeks programmeerbare GPU’s CUDA programmeermodel (= extensie van C) Makkelijk voor programmeurs Versnelt het rekenproces 4 GeForce 8800 Kasper Van Remoortere - Nils Lamot
  • 5. Programmeertaal - CUDA Programmeeromgeving van Nvidia Doelen: Uitbreiding C/C++  uitdrukking parallellisme vereenvoudigen Code goed verdelen over threads Vb.: Huidige GPU’s - 30 720 threads 5 Kasper Van Remoortere - Nils Lamot
  • 6. Programmeertaal - onderdelen 6 Rooster van blokken Parallelle Threads
  • 7. Programmeertaal - geheugen 7 HS gedeeld geheugen Data-parallel > Task-parallel Globaal geheugen
  • 8. Architectuur - Tesla Doel: programma’s in CUDA optimaal uitvoeren Aanmaak, planning, resource management  In hardware opgenomen Tijd creëren/verwijderen = verwaarloosbaar Geoptimaliseerd in het verwerken van opeenvolgende, gelijkende patronen 8 Kasper Van Remoortere - Nils Lamot
  • 9.
  • 10. SIMT: blok thread = warp van 32 threads SP cores: toegang tot assortiment instructies Multithreading: grote cache overbodig Kasper Van Remoortere - Nils Lamot
  • 11. Applicaties Moleculaire bewegingen Numerieke lineaire algebra Medische sector Beweging van vloeistoffen Seismologie 10
  • 12. Applicatie – Numerieke lineaire algebraMatrixvermenigvuldiging Berekeningen verdeelbaar in blokken 11 Hoe matrices vermenigvuldigen: A x B = C a1,1 x b1,1 + a1,2 x b2,1 +… = c1,1 Kasper Van Remoortere - Nils Lamot
  • 13. 12 Applicatie – Numerieke lineaire algebraAlgoritme Volkov en Demmel vs. MKL Kasper Van Remoortere - Nils Lamot
  • 14. Applicatie – Numerieke lineaire algebraVerklaring snelheid algoritme V&D Data-blocks opgeslagen in GPU-registersregister = groot  tijdelijke opslag berekeningen Blokken elementen /thread  1/thread Software prefetching wachttijd geheugen 13 Kasper Van Remoortere - Nils Lamot
  • 15. Applicatie – Numerieke lineaire algebraMatrix factorisatie Matrix naar eenvoudigste vorm omzetten Oplossen stelsels Factorisatiemethodes: LU Cholesky QR factorisatie 14 Kasper Van Remoortere - Nils Lamot
  • 16. 15 Kasper Van Remoortere - Nils Lamot
  • 17. Conclusies Cuda bruikbaar voor data-parallel programmeren Cuda voor groot publiek beschikbaar 16 Kasper Van Remoortere - Nils Lamot