SlideShare ist ein Scribd-Unternehmen logo
1 von 23
АЛ-31 для СУ-27 Двигатель для «Сухой
«Суперджет»
15 лет 6 лет
50 опытных образцов 8 тестовых образцов
3.5 млрд долларов 600 млн евро
Лишь 5% продукции
производится без моделирования
"Суперкомпьютерные технологии в современном мире
стали стратегической областью, без которой
невозможно дальнейшее развитие.
Мощность национальных суперкомпьютеров сейчас так
же важна, как мощность электростанций или
количество боеголовок."
Современное состояние
отрасли высокопроизводительных
вычислений
Кизько Б. А.,
5085/2, ИИТ, ФГБОУ ВПО СПбГПУ
2013
High-performance computing (HPC)
top500.org
1978 г. - Intel 8086 4.77 Мгц
2004 г. - Intel Pentium 4 3.46 GHz
2005 г. - Intel Pentium 4 3.8 GHz
2005 г. - 2 вычислительных ядра: AMD
Athlon 64 X2, IBM PowerPC 970 и Intel
Pentium D
Центральные процессоры (CPU)
2005 г. - 2 вычислительных ядра
2007 г. - 4 ядра CPU
2010 г. - 6 ядер (12 ядер для серверов)
2011 г. - 8 ядер (16 ядер)
"Мультиядерная эволюция"
1994 г. - MPI 1 (Интерфейс передачи
сообщений)
1997 г. – OpenMP
2010г. – DirectCompute (DirectX 10)
2011 г. - C++11 AMP (MS VS 2012)
C#, Java. 2 вида многозадачности.
Как использовать многоядерность?
N - кол-во процессоров (ядер)
"Если мы можем распараллелить 3/4
всей программы, то максимальный
выигрыш составит 4 раза."
Закон Амдала ( Amdahl Law)
1
(1+P) +
N
P
S =
GPU
Cg, GLSL, HLSL
GPU
General-Purpose Computing
on Graphics Processing Unit
NVIDIA Compute Unified Device
Architecture
ноябрь 2006 г. - первый GPU с DirectX 10,
GeForce 8800 GTX с архитектурой CUDA
• Учѐт требований IEEE к арифметическим
операциям
• Набор команд, ориентированный на
вычисления
• Произвольный доступ к памяти для чтения и
записи
• CUDA Toolkit и CUDA SDK
NVIDIA Compute Unified Device
Architecture
NVIDIA Tesla
Intel Core i5 – 110 Гфлопс – 100 Вт
Core 2 Duo – 19 Гфлопс - 90 Вт
Tesla K20X – 3,95 Тфлопс – 225 Вт
Cray Titan
29 октября 2012
18 688 AMD Opteron (16 ядер в каждом)
18688 Tesla K20X
9 МВт, 404 кв. м
20 петафлопс (1015) – 1 место
NVIDIA Compute Unified Device
Architecture
Язык программирования C с расширениями
Распространѐнность GPU
GeForce 8, 9, 100, 200, 300, 400, 500, 600
NVIDIA CUDA. Применение
Прирост производительности CPU CPU
2 операций MD5:
100 Tesla = 10000 CPU - 2 дня
SHA-1:
Phenom II X4 3.4 GHz vs GF GTX 560 Ti (49152
потока) - 10 раз
Core2 Duo 2.26 GHz vs GF 9300M (8192 потока) -
3 раза
50
NVIDIA CUDA. Применение
Медицицина. TechniScan Svara - УЗИ
35 Гб данных за 15 минут
2 Tesla C1060 - 20 минут
Гидродинамика. Кэмбридж
Моделирование ПАВ. P&G
2 Tesla = Cray XT3 (128 CPU) или IBM BlueGene/L
(1024 CPU)
Геология, финансы, криптография...
NVIDIA CUDA. Применение
Наличие оптимизированных версий библиотек
FFT и BLAS, SPARSE, RAND, NPP...
Поддержка готовым ПО (MAGMA, Video
Encoder, Adobe Photoshop, Folding@Home,
Seti@Home, CoreAVC, Cyberlink Power Director,
...
Open Compute Language
Khronos Group: AMD, Intel, Motorola, Apple,
NVIDIA, IBM, ARM
2008 г. - OpenCL 1.0
1 декабря 2012 г. - OpenCL 1.2
C99 с новыми ключевыми словами
Открытый стандарт
Широкая поддержка оборудования
Прирост в WinZip 16.5 на AMD APU - 45%
HSA Foundation
AMD, ARM, Samsung, Texas
Instruments, Qualcomm, MediaTek, Imagination
Technologies
Intel
Larrabee -> Xeon Phi
Архитектура x86
Много ядер Pentium в одном чипе с общей памятью
Взаимодействие NVIDIA с ВУЗами
269 университетов мира
СПбГПУ, СПбГУ, "Дубна", ОИЯИ,
МИЭТ, МГТУ им. Баумана, МАИ,
"Курчатовский институт",
МГУ им. Ломоносова, ...
декабрь 2009 - научно-образовательный центр
"Параллельные вычисления", Дубна
Список источников
1. Сайты HSA Foundation, NVIDIA, AMD,
Khronos Group
2. thg.ru - подробный обзор Intel Xeon Phi
3. Wikipedia
4. Статьи с habrahabr.ru
5. Сайт научно-образовательного центра
"Параллельные вычисления"
http://www.parallel-compute.ru/
6. opencl.org
7. gpgpu.org
8. Результаты НИР на 3-4 курсах. Научный
руководитель - Семьянов П. В.
Благодарю за
внимание!

Weitere ähnliche Inhalte

Was ist angesagt?

Как подобрать ПК для профессиональной работы
Как подобрать ПК для профессиональной работыКак подобрать ПК для профессиональной работы
Как подобрать ПК для профессиональной работыKaty88850
 
Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...Global Innovation Labs
 
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Ontico
 
Domashniy kompyuter it s kommentariyami
Domashniy kompyuter it s kommentariyamiDomashniy kompyuter it s kommentariyami
Domashniy kompyuter it s kommentariyamiMaxKozlov5
 
СХД для обработки сейсмики: сравнительный обзор
СХД для обработки сейсмики: сравнительный обзорСХД для обработки сейсмики: сравнительный обзор
СХД для обработки сейсмики: сравнительный обзорVsevolod Shabad
 
project "Komputer for the gamer"
project "Komputer for the gamer"project "Komputer for the gamer"
project "Komputer for the gamer"artemchik
 
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)Ontico
 
HPC file systems (160761)
HPC file systems (160761)HPC file systems (160761)
HPC file systems (160761)Vsevolod Shabad
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Mikhail Kurnosov
 
Domashniy kompyuter it
Domashniy kompyuter itDomashniy kompyuter it
Domashniy kompyuter itMaxKozlov5
 
Технология Infiniband скорость, легкость, надежность
Технология Infiniband скорость, легкость, надежностьТехнология Infiniband скорость, легкость, надежность
Технология Infiniband скорость, легкость, надежностьКРОК
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...Mikhail Kurnosov
 
Инфраструктура хранения для KADME Whereoil
Инфраструктура хранения для KADME WhereoilИнфраструктура хранения для KADME Whereoil
Инфраструктура хранения для KADME WhereoilVsevolod Shabad
 
лекция 17
лекция 17лекция 17
лекция 17JIuc
 
Про эмуляторы
Про эмуляторыПро эмуляторы
Про эмуляторыNikita Zimin
 

Was ist angesagt? (19)

Как подобрать ПК для профессиональной работы
Как подобрать ПК для профессиональной работыКак подобрать ПК для профессиональной работы
Как подобрать ПК для профессиональной работы
 
Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
 
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
 
Domashniy kompyuter it s kommentariyami
Domashniy kompyuter it s kommentariyamiDomashniy kompyuter it s kommentariyami
Domashniy kompyuter it s kommentariyami
 
СХД для обработки сейсмики: сравнительный обзор
СХД для обработки сейсмики: сравнительный обзорСХД для обработки сейсмики: сравнительный обзор
СХД для обработки сейсмики: сравнительный обзор
 
project "Komputer for the gamer"
project "Komputer for the gamer"project "Komputer for the gamer"
project "Komputer for the gamer"
 
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
 
HPC file systems (160761)
HPC file systems (160761)HPC file systems (160761)
HPC file systems (160761)
 
Efficiency vvv
Efficiency vvvEfficiency vvv
Efficiency vvv
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
 
Domashniy kompyuter it
Domashniy kompyuter itDomashniy kompyuter it
Domashniy kompyuter it
 
Cuda, OpenCL
Cuda, OpenCLCuda, OpenCL
Cuda, OpenCL
 
Технология Infiniband скорость, легкость, надежность
Технология Infiniband скорость, легкость, надежностьТехнология Infiniband скорость, легкость, надежность
Технология Infiniband скорость, легкость, надежность
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
 
King Xeon
King XeonKing Xeon
King Xeon
 
Инфраструктура хранения для KADME Whereoil
Инфраструктура хранения для KADME WhereoilИнфраструктура хранения для KADME Whereoil
Инфраструктура хранения для KADME Whereoil
 
лекция 17
лекция 17лекция 17
лекция 17
 
Про эмуляторы
Про эмуляторыПро эмуляторы
Про эмуляторы
 
Nvidia hpc day 2011 kiev
Nvidia hpc day 2011 kievNvidia hpc day 2011 kiev
Nvidia hpc day 2011 kiev
 

Andere mochten auch

спутниковые радионавигационные системы
спутниковые радионавигационные системыспутниковые радионавигационные системы
спутниковые радионавигационные системыBoris Kizko
 
Chap002 business ethics and sr
Chap002 business ethics and srChap002 business ethics and sr
Chap002 business ethics and srMrQaz996
 
11 microsoft excel 2007
11 microsoft excel 200711 microsoft excel 2007
11 microsoft excel 2007MrQaz996
 
16 making charts
16 making charts16 making charts
16 making chartsMrQaz996
 
6 internet and web
6 internet and web6 internet and web
6 internet and webMrQaz996
 
2 operating systems and utility softwares
2 operating systems and utility softwares2 operating systems and utility softwares
2 operating systems and utility softwaresMrQaz996
 
21 digital communication
21 digital communication21 digital communication
21 digital communicationMrQaz996
 
9 paragraph, styles and page setup
9 paragraph, styles and page setup9 paragraph, styles and page setup
9 paragraph, styles and page setupMrQaz996
 
Gaming Technology Presentation
Gaming Technology PresentationGaming Technology Presentation
Gaming Technology PresentationMrQaz996
 
Touch Screen Technology PRESENTATION
Touch Screen Technology PRESENTATIONTouch Screen Technology PRESENTATION
Touch Screen Technology PRESENTATIONMrQaz996
 

Andere mochten auch (12)

Laporan project akhir
Laporan project akhirLaporan project akhir
Laporan project akhir
 
Laporan project akhir
Laporan project akhirLaporan project akhir
Laporan project akhir
 
спутниковые радионавигационные системы
спутниковые радионавигационные системыспутниковые радионавигационные системы
спутниковые радионавигационные системы
 
Chap002 business ethics and sr
Chap002 business ethics and srChap002 business ethics and sr
Chap002 business ethics and sr
 
11 microsoft excel 2007
11 microsoft excel 200711 microsoft excel 2007
11 microsoft excel 2007
 
16 making charts
16 making charts16 making charts
16 making charts
 
6 internet and web
6 internet and web6 internet and web
6 internet and web
 
2 operating systems and utility softwares
2 operating systems and utility softwares2 operating systems and utility softwares
2 operating systems and utility softwares
 
21 digital communication
21 digital communication21 digital communication
21 digital communication
 
9 paragraph, styles and page setup
9 paragraph, styles and page setup9 paragraph, styles and page setup
9 paragraph, styles and page setup
 
Gaming Technology Presentation
Gaming Technology PresentationGaming Technology Presentation
Gaming Technology Presentation
 
Touch Screen Technology PRESENTATION
Touch Screen Technology PRESENTATIONTouch Screen Technology PRESENTATION
Touch Screen Technology PRESENTATION
 

Ähnlich wie Hpc 1.24.02.2013.

SPEC CPU2006 Rate
SPEC CPU2006 RateSPEC CPU2006 Rate
SPEC CPU2006 RateOleg Korol
 
Инструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningИнструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningSkolkovo Robotics Center
 
11 встреча — Введение в GPGPU (А. Свириденков)
11 встреча — Введение в GPGPU (А. Свириденков)11 встреча — Введение в GPGPU (А. Свириденков)
11 встреча — Введение в GPGPU (А. Свириденков)Smolensk Computer Science Club
 
Вебинар «Серверы Fujitsu PRIMERGY – обновление модельного ряда»
Вебинар «Серверы Fujitsu PRIMERGY – обновление модельного ряда»Вебинар «Серверы Fujitsu PRIMERGY – обновление модельного ряда»
Вебинар «Серверы Fujitsu PRIMERGY – обновление модельного ряда»Fujitsu Russia
 
Intel desktop processors
Intel desktop processorsIntel desktop processors
Intel desktop processorsKlun
 
Сервисы Azure для научных исследований
Сервисы Azure для научных исследованийСервисы Azure для научных исследований
Сервисы Azure для научных исследованийMicrosoft
 
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Cisco Russia
 
Владимир Назаров, HPE: Зачем нужна миграция с UNIX на Linux? Выводы на основ...
Владимир Назаров, HPE:  Зачем нужна миграция с UNIX на Linux? Выводы на основ...Владимир Назаров, HPE:  Зачем нужна миграция с UNIX на Linux? Выводы на основ...
Владимир Назаров, HPE: Зачем нужна миграция с UNIX на Linux? Выводы на основ...Банковское обозрение
 
Aппаратное обеспечения для решения задач механики сыпучих сред
Aппаратное обеспечения для решения задач механики сыпучих средAппаратное обеспечения для решения задач механики сыпучих сред
Aппаратное обеспечения для решения задач механики сыпучих средYury Novozhilov
 
презентация на защиту 06.06
презентация на защиту 06.06презентация на защиту 06.06
презентация на защиту 06.06Boris Kizko
 
Параллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартахПараллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартахAlex Tutubalin
 
ETegro: решения для ЦОД
ETegro: решения для ЦОДETegro: решения для ЦОД
ETegro: решения для ЦОДMirantis IT Russia
 
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...Kaspersky
 
16 процессоры и память эвм лекция
16 процессоры и память эвм лекция16 процессоры и память эвм лекция
16 процессоры и память эвм лекцияSergey Lomakin
 
overview of development tools for computing Gpgpu
overview of development tools for computing Gpgpuoverview of development tools for computing Gpgpu
overview of development tools for computing Gpgpucorehard_by
 
обзор средств разработки для вычислений Gpgpu
обзор средств разработки для вычислений Gpgpuобзор средств разработки для вычислений Gpgpu
обзор средств разработки для вычислений GpgpuCOMAQA.BY
 

Ähnlich wie Hpc 1.24.02.2013. (20)

SPEC CPU2006 Rate
SPEC CPU2006 RateSPEC CPU2006 Rate
SPEC CPU2006 Rate
 
Micro max 2011 ak corr
Micro max 2011 ak corrMicro max 2011 ak corr
Micro max 2011 ak corr
 
Инструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningИнструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learning
 
11 встреча — Введение в GPGPU (А. Свириденков)
11 встреча — Введение в GPGPU (А. Свириденков)11 встреча — Введение в GPGPU (А. Свириденков)
11 встреча — Введение в GPGPU (А. Свириденков)
 
Вебинар «Серверы Fujitsu PRIMERGY – обновление модельного ряда»
Вебинар «Серверы Fujitsu PRIMERGY – обновление модельного ряда»Вебинар «Серверы Fujitsu PRIMERGY – обновление модельного ряда»
Вебинар «Серверы Fujitsu PRIMERGY – обновление модельного ряда»
 
Intel desktop processors
Intel desktop processorsIntel desktop processors
Intel desktop processors
 
Сервисы Azure для научных исследований
Сервисы Azure для научных исследованийСервисы Azure для научных исследований
Сервисы Azure для научных исследований
 
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
 
Владимир Назаров, HPE: Зачем нужна миграция с UNIX на Linux? Выводы на основ...
Владимир Назаров, HPE:  Зачем нужна миграция с UNIX на Linux? Выводы на основ...Владимир Назаров, HPE:  Зачем нужна миграция с UNIX на Linux? Выводы на основ...
Владимир Назаров, HPE: Зачем нужна миграция с UNIX на Linux? Выводы на основ...
 
supercluster
superclustersupercluster
supercluster
 
Aппаратное обеспечения для решения задач механики сыпучих сред
Aппаратное обеспечения для решения задач механики сыпучих средAппаратное обеспечения для решения задач механики сыпучих сред
Aппаратное обеспечения для решения задач механики сыпучих сред
 
презентация на защиту 06.06
презентация на защиту 06.06презентация на защиту 06.06
презентация на защиту 06.06
 
HPCSolutions (c)2018
HPCSolutions  (c)2018HPCSolutions  (c)2018
HPCSolutions (c)2018
 
Параллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартахПараллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартах
 
ETegro: решения для ЦОД
ETegro: решения для ЦОДETegro: решения для ЦОД
ETegro: решения для ЦОД
 
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
 
16 процессоры и память эвм лекция
16 процессоры и память эвм лекция16 процессоры и память эвм лекция
16 процессоры и память эвм лекция
 
overview of development tools for computing Gpgpu
overview of development tools for computing Gpgpuoverview of development tools for computing Gpgpu
overview of development tools for computing Gpgpu
 
обзор средств разработки для вычислений Gpgpu
обзор средств разработки для вычислений Gpgpuобзор средств разработки для вычислений Gpgpu
обзор средств разработки для вычислений Gpgpu
 
Chipset
ChipsetChipset
Chipset
 

Mehr von Boris Kizko

Security cores 5.11.13
Security cores   5.11.13Security cores   5.11.13
Security cores 5.11.13Boris Kizko
 
Security cores 1.10.13
Security cores   1.10.13Security cores   1.10.13
Security cores 1.10.13Boris Kizko
 
Неделя науки 2013 СПбГПУ
Неделя науки 2013 СПбГПУНеделя науки 2013 СПбГПУ
Неделя науки 2013 СПбГПУBoris Kizko
 
Асимметричная криптография
Асимметричная криптографияАсимметричная криптография
Асимметричная криптографияBoris Kizko
 
Компьютерные вирусы
Компьютерные вирусыКомпьютерные вирусы
Компьютерные вирусыBoris Kizko
 
Dbs prezentation
Dbs prezentationDbs prezentation
Dbs prezentationBoris Kizko
 

Mehr von Boris Kizko (8)

Security cores 5.11.13
Security cores   5.11.13Security cores   5.11.13
Security cores 5.11.13
 
Security cores 1.10.13
Security cores   1.10.13Security cores   1.10.13
Security cores 1.10.13
 
Неделя науки 2013 СПбГПУ
Неделя науки 2013 СПбГПУНеделя науки 2013 СПбГПУ
Неделя науки 2013 СПбГПУ
 
Асимметричная криптография
Асимметричная криптографияАсимметричная криптография
Асимметричная криптография
 
Trojans, worms
Trojans, wormsTrojans, worms
Trojans, worms
 
Backdoors
BackdoorsBackdoors
Backdoors
 
Компьютерные вирусы
Компьютерные вирусыКомпьютерные вирусы
Компьютерные вирусы
 
Dbs prezentation
Dbs prezentationDbs prezentation
Dbs prezentation
 

Hpc 1.24.02.2013.

  • 1. АЛ-31 для СУ-27 Двигатель для «Сухой «Суперджет» 15 лет 6 лет 50 опытных образцов 8 тестовых образцов 3.5 млрд долларов 600 млн евро
  • 2. Лишь 5% продукции производится без моделирования "Суперкомпьютерные технологии в современном мире стали стратегической областью, без которой невозможно дальнейшее развитие. Мощность национальных суперкомпьютеров сейчас так же важна, как мощность электростанций или количество боеголовок."
  • 5. 1978 г. - Intel 8086 4.77 Мгц 2004 г. - Intel Pentium 4 3.46 GHz 2005 г. - Intel Pentium 4 3.8 GHz 2005 г. - 2 вычислительных ядра: AMD Athlon 64 X2, IBM PowerPC 970 и Intel Pentium D Центральные процессоры (CPU)
  • 6. 2005 г. - 2 вычислительных ядра 2007 г. - 4 ядра CPU 2010 г. - 6 ядер (12 ядер для серверов) 2011 г. - 8 ядер (16 ядер) "Мультиядерная эволюция"
  • 7. 1994 г. - MPI 1 (Интерфейс передачи сообщений) 1997 г. – OpenMP 2010г. – DirectCompute (DirectX 10) 2011 г. - C++11 AMP (MS VS 2012) C#, Java. 2 вида многозадачности. Как использовать многоядерность?
  • 8. N - кол-во процессоров (ядер) "Если мы можем распараллелить 3/4 всей программы, то максимальный выигрыш составит 4 раза." Закон Амдала ( Amdahl Law) 1 (1+P) + N P S =
  • 11. NVIDIA Compute Unified Device Architecture ноябрь 2006 г. - первый GPU с DirectX 10, GeForce 8800 GTX с архитектурой CUDA • Учѐт требований IEEE к арифметическим операциям • Набор команд, ориентированный на вычисления • Произвольный доступ к памяти для чтения и записи • CUDA Toolkit и CUDA SDK
  • 12. NVIDIA Compute Unified Device Architecture NVIDIA Tesla Intel Core i5 – 110 Гфлопс – 100 Вт Core 2 Duo – 19 Гфлопс - 90 Вт Tesla K20X – 3,95 Тфлопс – 225 Вт
  • 13. Cray Titan 29 октября 2012 18 688 AMD Opteron (16 ядер в каждом) 18688 Tesla K20X 9 МВт, 404 кв. м 20 петафлопс (1015) – 1 место
  • 14. NVIDIA Compute Unified Device Architecture Язык программирования C с расширениями Распространѐнность GPU GeForce 8, 9, 100, 200, 300, 400, 500, 600
  • 15. NVIDIA CUDA. Применение Прирост производительности CPU CPU 2 операций MD5: 100 Tesla = 10000 CPU - 2 дня SHA-1: Phenom II X4 3.4 GHz vs GF GTX 560 Ti (49152 потока) - 10 раз Core2 Duo 2.26 GHz vs GF 9300M (8192 потока) - 3 раза 50
  • 16. NVIDIA CUDA. Применение Медицицина. TechniScan Svara - УЗИ 35 Гб данных за 15 минут 2 Tesla C1060 - 20 минут Гидродинамика. Кэмбридж Моделирование ПАВ. P&G 2 Tesla = Cray XT3 (128 CPU) или IBM BlueGene/L (1024 CPU) Геология, финансы, криптография...
  • 17. NVIDIA CUDA. Применение Наличие оптимизированных версий библиотек FFT и BLAS, SPARSE, RAND, NPP... Поддержка готовым ПО (MAGMA, Video Encoder, Adobe Photoshop, Folding@Home, Seti@Home, CoreAVC, Cyberlink Power Director, ...
  • 18. Open Compute Language Khronos Group: AMD, Intel, Motorola, Apple, NVIDIA, IBM, ARM 2008 г. - OpenCL 1.0 1 декабря 2012 г. - OpenCL 1.2 C99 с новыми ключевыми словами Открытый стандарт Широкая поддержка оборудования Прирост в WinZip 16.5 на AMD APU - 45%
  • 19. HSA Foundation AMD, ARM, Samsung, Texas Instruments, Qualcomm, MediaTek, Imagination Technologies
  • 20. Intel Larrabee -> Xeon Phi Архитектура x86 Много ядер Pentium в одном чипе с общей памятью
  • 21. Взаимодействие NVIDIA с ВУЗами 269 университетов мира СПбГПУ, СПбГУ, "Дубна", ОИЯИ, МИЭТ, МГТУ им. Баумана, МАИ, "Курчатовский институт", МГУ им. Ломоносова, ... декабрь 2009 - научно-образовательный центр "Параллельные вычисления", Дубна
  • 22. Список источников 1. Сайты HSA Foundation, NVIDIA, AMD, Khronos Group 2. thg.ru - подробный обзор Intel Xeon Phi 3. Wikipedia 4. Статьи с habrahabr.ru 5. Сайт научно-образовательного центра "Параллельные вычисления" http://www.parallel-compute.ru/ 6. opencl.org 7. gpgpu.org 8. Результаты НИР на 3-4 курсах. Научный руководитель - Семьянов П. В.