1. Ervaring met parallel computing van Cuda Kasper Van Remoortere Nils Lamot 1ste Bachelor Informatica
2. Inhoudstafel Situatieschets GeForce 8800 Programmeertaal: CUDA Architectuur: Tesla Applicatie voorbeeld Conclusies 2 Kasper Van Remoortere - Nils Lamot
3. Situatieschets Kloksnelheid verhogen Parallel geschakelde processors Efficiënt gebruik? GPU’s al langer parallel real-timegraphics 3 Kasper Van Remoortere - Nils Lamot
4. Tesla architectuur Rechtstreeks programmeerbare GPU’s CUDA programmeermodel (= extensie van C) Makkelijk voor programmeurs Versnelt het rekenproces 4 GeForce 8800 Kasper Van Remoortere - Nils Lamot
5. Programmeertaal - CUDA Programmeeromgeving van Nvidia Doelen: Uitbreiding C/C++ uitdrukking parallellisme vereenvoudigen Code goed verdelen over threads Vb.: Huidige GPU’s - 30 720 threads 5 Kasper Van Remoortere - Nils Lamot
8. Architectuur - Tesla Doel: programma’s in CUDA optimaal uitvoeren Aanmaak, planning, resource management In hardware opgenomen Tijd creëren/verwijderen = verwaarloosbaar Geoptimaliseerd in het verwerken van opeenvolgende, gelijkende patronen 8 Kasper Van Remoortere - Nils Lamot
9.
10. SIMT: blok thread = warp van 32 threads SP cores: toegang tot assortiment instructies Multithreading: grote cache overbodig Kasper Van Remoortere - Nils Lamot
12. Applicatie – Numerieke lineaire algebraMatrixvermenigvuldiging Berekeningen verdeelbaar in blokken 11 Hoe matrices vermenigvuldigen: A x B = C a1,1 x b1,1 + a1,2 x b2,1 +… = c1,1 Kasper Van Remoortere - Nils Lamot
13. 12 Applicatie – Numerieke lineaire algebraAlgoritme Volkov en Demmel vs. MKL Kasper Van Remoortere - Nils Lamot
14. Applicatie – Numerieke lineaire algebraVerklaring snelheid algoritme V&D Data-blocks opgeslagen in GPU-registersregister = groot tijdelijke opslag berekeningen Blokken elementen /thread 1/thread Software prefetching wachttijd geheugen 13 Kasper Van Remoortere - Nils Lamot
15. Applicatie – Numerieke lineaire algebraMatrix factorisatie Matrix naar eenvoudigste vorm omzetten Oplossen stelsels Factorisatiemethodes: LU Cholesky QR factorisatie 14 Kasper Van Remoortere - Nils Lamot