SlideShare ist ein Scribd-Unternehmen logo
1 von 33
АЛ-31 для СУ-27 Двигатель для «Сухой
«Суперджет»
15 лет 6 лет
50 опытных образцов 8 тестовых образцов
3.5 млрд долларов 600 млн евро
Большинство суперкомпьютеров
(список top500.org) – гетерогенные среды.
CPU : GPU = 1 : n (n = 1, 2, 3,…)
Cray Titan
29 октября 2012
18 688 AMD Opteron (16 ядер в каждом)
18688 Tesla K20X
9 МВт, 404 кв. м
20 петафлопс (1015) – 1 место
Архитектура GPU. Технологии GPGPU.
Кизько Б. А.,
5085/2, ИИТ, ФГБОУ ВПО СПбГПУ
26.03.2013
GPU
Построение в реальном времени изображений по
описанию трехмерных сцен
GPU
Быстрая однородная обработка большого
количества элементов
Аппаратная реализация основных алгоритмов
Графический процессор изначально создавался
как многоядерная структура (сотни ядер).
GPU
CPU vs GPU
Гораздо больше транзисторов GPU
отведено на обработку данных,
а не на управление исполнением
(т.н. Flow control)
GPU
Cg, GLSL, HLSL
GPU
General-Purpose Computing
on Graphics Processing Unit
NVIDIA Compute Unified Device
Architecture
Intel Core i5 – 110 Гфлопс – 100 Вт
Core 2 Duo – 19 Гфлопс - 90 Вт
Tesla K20X – 3,95 Тфлопс – 225 Вт
Radeon HD 7660G – 380 Гфлопс - 35 Вт
GPGPU до 2007 года
Шейдерные языки Cg, GLSL и HLSL
GLSL – OpenGL
HLSL – Microsoft DirectX
1. Широкая поддержка оборудования.
2. Отсутствие готовых библиотек.
3. Необходимо знание специализированного
языка
4. Привязка к графическим API.
GPGPU до 2007 года
5. Отсутствует возможность взаимодействия
между пикселями.
6. Отсутствуют операции типа scatter – есть
только gather.
GPGPU до 2007 года
7. Приложения часто ограничены ПСП.
Простой вычислительных мощностей!
NVIDIA Compute Unified Device
Architecture
ноябрь 2006 г. - первый GPU с DirectX 10,
GeForce 8800 GTX с архитектурой CUDA
• Учѐт требований IEEE к арифметическим
операциям
• Набор команд, ориентированный на
вычисления. Независимость от графических
API
• Произвольный доступ к памяти для чтения и
записи
• CUDA Toolkit и CUDA SDK
NVIDIA CUDA
Есть байт-адресация
Gather
Scatter
NVIDIA CUDA
Доступ к регистровой разделяемой памяти
для обмена данными между потоками
NVIDIA Compute Unified Device
Architecture
Язык программирования C с расширениями
Распространѐнность GPU
GeForce 8, 9, 100, 200, 300, 400, 500, 600, 700
NVIDIA Compute Unified Device Architecture
GPU – сопроцессор (device) для CPU (host)
Собственная память (память устройства, device
memory)
Параллельная обработка множества потоков
Ядро (kernel) – исполняемая над большим числом
потоков функция с параллелизмом данных
Отличия потоков GPU от CPU:
•Для полной эффективности GPU нужны тысячи
потоков
•Легковесность, низкие накладные расходы на
создание
NVIDIA Compute Unified Device
Architecture
NVIDIA Compute Unified Device
Architecture
SIMD (Single Instruction – Multiple Data)
SIMT (Single Instruction – Multiple Thread)
Несколько видов памяти
(регистры, локальная,
разделяемая, глобальная,
константная, текстурная) с
разными правами доступа
NVIDIA Compute Unified Device
Architecture
Open Compute Language
Khronos Group: AMD, Intel, Motorola, Apple,
NVIDIA, IBM, ARM
2008 г. - OpenCL 1.0
1 декабря 2012 г. - OpenCL 1.2
C99 с новыми ключевыми словами
Открытый стандарт
Широкая поддержка оборудования
Прирост в WinZip 16.5 на AMD APU - 45%
Open Compute Language
CPU (host) управляет OpenCL-устройствами
(devices): CPU, GPU, DSP, …
Open Compute Language
WinZip, ArcSoft, Corel VideoStudio, GIMP,
Mathematica 8, vReveal, Blender, BattleField 3, …
PyOpenCL, WebCL (JS-интерфейс для обработки
вычислений в браузере, поддержка в Firefox и
WebKit), ScalaCL, Ruby-OpenCL
PGI OpenCL Compiler, OpenCL Studio, ZiiLABD
OpenCL SDK
http://openclnews.com/apps
Open Compute Language
AMD OpenCL University Kit
Набор материалов от AMD для обучения
технологии в течение семестра.
13 лекций с примерами кода и набором заданий
http://developer.amd.com/resources/heterogeneous-
computing/opencl-zone/
HSA Foundation
AMD, ARM, Samsung, Texas Instruments,
Qualcomm, MediaTek, Imagination Technologies
Intel
Larrabee -> Xeon Phi
Архитектура x86
Много ядер Pentium в одном чипе с общей памятью
Intel Xeon Phi
Сопроцессор 5110P:
60 ядер Pentium 1GHz с EM64T, 4 потока/ядро
512-бит SIMD
512К L2
1 TFLOPS
6/8 Gb GDDR5
RHEL 6.x
SuSE Linux 12
Intel Xeon Phi
Взаимодействие NVIDIA с ВУЗами
269 университетов мира
СПбГПУ, СПбГУ, "Дубна", ОИЯИ,
МИЭТ, МГТУ им. Баумана, МАИ,
"Курчатовский институт",
МГУ им. Ломоносова, ...
декабрь 2009 - научно-образовательный центр
"Параллельные вычисления", Дубна
Список источников
1. Сайты HSA Foundation, NVIDIA, AMD,
Khronos Group
2. thg.ru - подробный обзор Intel Xeon Phi
3. Wikipedia
4. Статьи с habrahabr.ru
5. Сайт научно-образовательного центра
"Параллельные вычисления"
http://www.parallel-compute.ru/
6. opencl.org
7. gpgpu.org
8. Результаты НИР на 3-4 курсах. Научный
руководитель - Семьянов П. В.
Благодарю за
внимание!

Weitere ähnliche Inhalte

Was ist angesagt?

обзор средств разработки для вычислений Gpgpu
обзор средств разработки для вычислений Gpgpuобзор средств разработки для вычислений Gpgpu
обзор средств разработки для вычислений GpgpuCOMAQA.BY
 
Возможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровВозможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровVsevolod Shabad
 
Программно-технические комплексы для работы с геолого-геофизическими данными
Программно-технические комплексы для работы с геолого-геофизическими даннымиПрограммно-технические комплексы для работы с геолого-геофизическими данными
Программно-технические комплексы для работы с геолого-геофизическими даннымиVsevolod Shabad
 
СХД для обработки сейсмики: сравнительный обзор
СХД для обработки сейсмики: сравнительный обзорСХД для обработки сейсмики: сравнительный обзор
СХД для обработки сейсмики: сравнительный обзорVsevolod Shabad
 
Лекция 11: Программирование графических процессоров на NVIDIA CUDA
Лекция 11: Программирование графических процессоров на NVIDIA CUDAЛекция 11: Программирование графических процессоров на NVIDIA CUDA
Лекция 11: Программирование графических процессоров на NVIDIA CUDAMikhail Kurnosov
 
Мощнее или умнее? Возможности оптимизации ИТ-инфраструктуры для сейсмики
Мощнее или умнее? Возможности оптимизации ИТ-инфраструктуры для сейсмикиМощнее или умнее? Возможности оптимизации ИТ-инфраструктуры для сейсмики
Мощнее или умнее? Возможности оптимизации ИТ-инфраструктуры для сейсмикиVsevolod Shabad
 
HPC file systems (160761)
HPC file systems (160761)HPC file systems (160761)
HPC file systems (160761)Vsevolod Shabad
 
Работа решателей Ansys на российском интерконнекте Ангара
Работа решателей Ansys на российском интерконнекте АнгараРабота решателей Ansys на российском интерконнекте Ангара
Работа решателей Ansys на российском интерконнекте АнгараYury Novozhilov
 
настройка Free Bsd для обслуживания 100 200 тысяч соединений игорь сысоев
настройка Free Bsd для обслуживания 100 200 тысяч соединений   игорь сысоевнастройка Free Bsd для обслуживания 100 200 тысяч соединений   игорь сысоев
настройка Free Bsd для обслуживания 100 200 тысяч соединений игорь сысоевMedia Gorod
 
Облачные технологии и решений ANSYS. Новые возможности ANSYS HPC
Облачные технологии и решений ANSYS. Новые возможности ANSYS HPCОблачные технологии и решений ANSYS. Новые возможности ANSYS HPC
Облачные технологии и решений ANSYS. Новые возможности ANSYS HPCYury Novozhilov
 
Базовые понятия 3D графики (Ден Шергин) - DEBUG TiME #3 2016
Базовые понятия 3D графики (Ден Шергин) - DEBUG TiME #3 2016Базовые понятия 3D графики (Ден Шергин) - DEBUG TiME #3 2016
Базовые понятия 3D графики (Ден Шергин) - DEBUG TiME #3 2016Unigine Corp.
 
Лекция 9. Программирование GPU
Лекция 9. Программирование GPUЛекция 9. Программирование GPU
Лекция 9. Программирование GPUMikhail Kurnosov
 
Продуктовая стратегия Baikal Electronics 2025
Продуктовая стратегия Baikal Electronics 2025Продуктовая стратегия Baikal Electronics 2025
Продуктовая стратегия Baikal Electronics 2025Leonid Salnikov
 
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)Ontico
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...Mikhail Kurnosov
 
Инфраструктура хранения для KADME Whereoil
Инфраструктура хранения для KADME WhereoilИнфраструктура хранения для KADME Whereoil
Инфраструктура хранения для KADME WhereoilVsevolod Shabad
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Mikhail Kurnosov
 
SAMag2007 Conference: PostgreSQL 8.3 presentation
SAMag2007 Conference: PostgreSQL 8.3 presentationSAMag2007 Conference: PostgreSQL 8.3 presentation
SAMag2007 Conference: PostgreSQL 8.3 presentationNikolay Samokhvalov
 

Was ist angesagt? (20)

обзор средств разработки для вычислений Gpgpu
обзор средств разработки для вычислений Gpgpuобзор средств разработки для вычислений Gpgpu
обзор средств разработки для вычислений Gpgpu
 
Возможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеровВозможности повышения производительности вычислительных кластеров
Возможности повышения производительности вычислительных кластеров
 
Conflux: GPGPU .NET
Conflux: GPGPU .NETConflux: GPGPU .NET
Conflux: GPGPU .NET
 
Программно-технические комплексы для работы с геолого-геофизическими данными
Программно-технические комплексы для работы с геолого-геофизическими даннымиПрограммно-технические комплексы для работы с геолого-геофизическими данными
Программно-технические комплексы для работы с геолого-геофизическими данными
 
СХД для обработки сейсмики: сравнительный обзор
СХД для обработки сейсмики: сравнительный обзорСХД для обработки сейсмики: сравнительный обзор
СХД для обработки сейсмики: сравнительный обзор
 
Лекция 11: Программирование графических процессоров на NVIDIA CUDA
Лекция 11: Программирование графических процессоров на NVIDIA CUDAЛекция 11: Программирование графических процессоров на NVIDIA CUDA
Лекция 11: Программирование графических процессоров на NVIDIA CUDA
 
Мощнее или умнее? Возможности оптимизации ИТ-инфраструктуры для сейсмики
Мощнее или умнее? Возможности оптимизации ИТ-инфраструктуры для сейсмикиМощнее или умнее? Возможности оптимизации ИТ-инфраструктуры для сейсмики
Мощнее или умнее? Возможности оптимизации ИТ-инфраструктуры для сейсмики
 
HPC file systems (160761)
HPC file systems (160761)HPC file systems (160761)
HPC file systems (160761)
 
Работа решателей Ansys на российском интерконнекте Ангара
Работа решателей Ansys на российском интерконнекте АнгараРабота решателей Ansys на российском интерконнекте Ангара
Работа решателей Ansys на российском интерконнекте Ангара
 
настройка Free Bsd для обслуживания 100 200 тысяч соединений игорь сысоев
настройка Free Bsd для обслуживания 100 200 тысяч соединений   игорь сысоевнастройка Free Bsd для обслуживания 100 200 тысяч соединений   игорь сысоев
настройка Free Bsd для обслуживания 100 200 тысяч соединений игорь сысоев
 
Облачные технологии и решений ANSYS. Новые возможности ANSYS HPC
Облачные технологии и решений ANSYS. Новые возможности ANSYS HPCОблачные технологии и решений ANSYS. Новые возможности ANSYS HPC
Облачные технологии и решений ANSYS. Новые возможности ANSYS HPC
 
Базовые понятия 3D графики (Ден Шергин) - DEBUG TiME #3 2016
Базовые понятия 3D графики (Ден Шергин) - DEBUG TiME #3 2016Базовые понятия 3D графики (Ден Шергин) - DEBUG TiME #3 2016
Базовые понятия 3D графики (Ден Шергин) - DEBUG TiME #3 2016
 
Лекция 9. Программирование GPU
Лекция 9. Программирование GPUЛекция 9. Программирование GPU
Лекция 9. Программирование GPU
 
HPCSolutions (c)2018
HPCSolutions  (c)2018HPCSolutions  (c)2018
HPCSolutions (c)2018
 
Продуктовая стратегия Baikal Electronics 2025
Продуктовая стратегия Baikal Electronics 2025Продуктовая стратегия Baikal Electronics 2025
Продуктовая стратегия Baikal Electronics 2025
 
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
 
Инфраструктура хранения для KADME Whereoil
Инфраструктура хранения для KADME WhereoilИнфраструктура хранения для KADME Whereoil
Инфраструктура хранения для KADME Whereoil
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
 
SAMag2007 Conference: PostgreSQL 8.3 presentation
SAMag2007 Conference: PostgreSQL 8.3 presentationSAMag2007 Conference: PostgreSQL 8.3 presentation
SAMag2007 Conference: PostgreSQL 8.3 presentation
 

Andere mochten auch

спутниковые радионавигационные системы
спутниковые радионавигационные системыспутниковые радионавигационные системы
спутниковые радионавигационные системыBoris Kizko
 
Chap002 business ethics and sr
Chap002 business ethics and srChap002 business ethics and sr
Chap002 business ethics and srMrQaz996
 
11 microsoft excel 2007
11 microsoft excel 200711 microsoft excel 2007
11 microsoft excel 2007MrQaz996
 
16 making charts
16 making charts16 making charts
16 making chartsMrQaz996
 
6 internet and web
6 internet and web6 internet and web
6 internet and webMrQaz996
 
2 operating systems and utility softwares
2 operating systems and utility softwares2 operating systems and utility softwares
2 operating systems and utility softwaresMrQaz996
 
21 digital communication
21 digital communication21 digital communication
21 digital communicationMrQaz996
 
9 paragraph, styles and page setup
9 paragraph, styles and page setup9 paragraph, styles and page setup
9 paragraph, styles and page setupMrQaz996
 
Gaming Technology Presentation
Gaming Technology PresentationGaming Technology Presentation
Gaming Technology PresentationMrQaz996
 
Touch Screen Technology PRESENTATION
Touch Screen Technology PRESENTATIONTouch Screen Technology PRESENTATION
Touch Screen Technology PRESENTATIONMrQaz996
 

Andere mochten auch (12)

Laporan project akhir
Laporan project akhirLaporan project akhir
Laporan project akhir
 
Laporan project akhir
Laporan project akhirLaporan project akhir
Laporan project akhir
 
спутниковые радионавигационные системы
спутниковые радионавигационные системыспутниковые радионавигационные системы
спутниковые радионавигационные системы
 
Chap002 business ethics and sr
Chap002 business ethics and srChap002 business ethics and sr
Chap002 business ethics and sr
 
11 microsoft excel 2007
11 microsoft excel 200711 microsoft excel 2007
11 microsoft excel 2007
 
16 making charts
16 making charts16 making charts
16 making charts
 
6 internet and web
6 internet and web6 internet and web
6 internet and web
 
2 operating systems and utility softwares
2 operating systems and utility softwares2 operating systems and utility softwares
2 operating systems and utility softwares
 
21 digital communication
21 digital communication21 digital communication
21 digital communication
 
9 paragraph, styles and page setup
9 paragraph, styles and page setup9 paragraph, styles and page setup
9 paragraph, styles and page setup
 
Gaming Technology Presentation
Gaming Technology PresentationGaming Technology Presentation
Gaming Technology Presentation
 
Touch Screen Technology PRESENTATION
Touch Screen Technology PRESENTATIONTouch Screen Technology PRESENTATION
Touch Screen Technology PRESENTATION
 

Ähnlich wie Hpc 2.26.03.2013.

Параллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартахПараллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартахAlex Tutubalin
 
Сервисы Azure для научных исследований
Сервисы Azure для научных исследованийСервисы Azure для научных исследований
Сервисы Azure для научных исследованийMicrosoft
 
Инструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningИнструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningSkolkovo Robotics Center
 
презентацияевстафьева
презентацияевстафьевапрезентацияевстафьева
презентацияевстафьеваsasha4334556
 
CUDA Course 2010 at MSU
CUDA Course 2010 at MSUCUDA Course 2010 at MSU
CUDA Course 2010 at MSUlarhat
 
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...VThn18
 
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыОбработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыVsevolod Shabad
 
overview of development tools for computing Gpgpu
overview of development tools for computing Gpgpuoverview of development tools for computing Gpgpu
overview of development tools for computing Gpgpucorehard_by
 
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыГидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыVsevolod Shabad
 
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Ontico
 
презентация костина сравнение 8.1 7
презентация костина сравнение 8.1 7презентация костина сравнение 8.1 7
презентация костина сравнение 8.1 7sasha4334556
 
Технические средства реализации информационных процессов
Технические средства реализации информационных процессовТехнические средства реализации информационных процессов
Технические средства реализации информационных процессовstudent_SSGA
 
Presentation Amd Cpu
Presentation Amd CpuPresentation Amd Cpu
Presentation Amd Cpuandrei145
 
Работа с Big Data
Работа с Big Data Работа с Big Data
Работа с Big Data MATLAB
 
Кластер БГУИР: расширенные возможности
Кластер БГУИР: расширенные возможностиКластер БГУИР: расширенные возможности
Кластер БГУИР: расширенные возможностиAlexey Demidchuk
 
Alexey Savchenko, Evangelist, Unreal Engine/ Epic Games
Alexey Savchenko, Evangelist, Unreal Engine/ Epic GamesAlexey Savchenko, Evangelist, Unreal Engine/ Epic Games
Alexey Savchenko, Evangelist, Unreal Engine/ Epic GamesWhite Nights Conference
 
35
3535
35JIuc
 
IForum 2016: Никита Семенов. Серьезный подход к серьезным проектам
IForum 2016: Никита Семенов. Серьезный подход к серьезным проектамIForum 2016: Никита Семенов. Серьезный подход к серьезным проектам
IForum 2016: Никита Семенов. Серьезный подход к серьезным проектамSECL
 

Ähnlich wie Hpc 2.26.03.2013. (20)

Параллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартахПараллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартах
 
Gpgpu
GpgpuGpgpu
Gpgpu
 
Сервисы Azure для научных исследований
Сервисы Azure для научных исследованийСервисы Azure для научных исследований
Сервисы Azure для научных исследований
 
Инструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learningИнструментарий Nvidia для deep learning
Инструментарий Nvidia для deep learning
 
презентацияевстафьева
презентацияевстафьевапрезентацияевстафьева
презентацияевстафьева
 
CUDA Course 2010 at MSU
CUDA Course 2010 at MSUCUDA Course 2010 at MSU
CUDA Course 2010 at MSU
 
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
 
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктурыОбработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
 
overview of development tools for computing Gpgpu
overview of development tools for computing Gpgpuoverview of development tools for computing Gpgpu
overview of development tools for computing Gpgpu
 
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыГидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
 
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
 
презентация костина сравнение 8.1 7
презентация костина сравнение 8.1 7презентация костина сравнение 8.1 7
презентация костина сравнение 8.1 7
 
Efficiency vvv
Efficiency vvvEfficiency vvv
Efficiency vvv
 
Технические средства реализации информационных процессов
Технические средства реализации информационных процессовТехнические средства реализации информационных процессов
Технические средства реализации информационных процессов
 
Presentation Amd Cpu
Presentation Amd CpuPresentation Amd Cpu
Presentation Amd Cpu
 
Работа с Big Data
Работа с Big Data Работа с Big Data
Работа с Big Data
 
Кластер БГУИР: расширенные возможности
Кластер БГУИР: расширенные возможностиКластер БГУИР: расширенные возможности
Кластер БГУИР: расширенные возможности
 
Alexey Savchenko, Evangelist, Unreal Engine/ Epic Games
Alexey Savchenko, Evangelist, Unreal Engine/ Epic GamesAlexey Savchenko, Evangelist, Unreal Engine/ Epic Games
Alexey Savchenko, Evangelist, Unreal Engine/ Epic Games
 
35
3535
35
 
IForum 2016: Никита Семенов. Серьезный подход к серьезным проектам
IForum 2016: Никита Семенов. Серьезный подход к серьезным проектамIForum 2016: Никита Семенов. Серьезный подход к серьезным проектам
IForum 2016: Никита Семенов. Серьезный подход к серьезным проектам
 

Mehr von Boris Kizko

Security cores 5.11.13
Security cores   5.11.13Security cores   5.11.13
Security cores 5.11.13Boris Kizko
 
Security cores 1.10.13
Security cores   1.10.13Security cores   1.10.13
Security cores 1.10.13Boris Kizko
 
Неделя науки 2013 СПбГПУ
Неделя науки 2013 СПбГПУНеделя науки 2013 СПбГПУ
Неделя науки 2013 СПбГПУBoris Kizko
 
Асимметричная криптография
Асимметричная криптографияАсимметричная криптография
Асимметричная криптографияBoris Kizko
 
Компьютерные вирусы
Компьютерные вирусыКомпьютерные вирусы
Компьютерные вирусыBoris Kizko
 
Dbs prezentation
Dbs prezentationDbs prezentation
Dbs prezentationBoris Kizko
 
презентация на защиту 06.06
презентация на защиту 06.06презентация на защиту 06.06
презентация на защиту 06.06Boris Kizko
 

Mehr von Boris Kizko (9)

Security cores 5.11.13
Security cores   5.11.13Security cores   5.11.13
Security cores 5.11.13
 
Security cores 1.10.13
Security cores   1.10.13Security cores   1.10.13
Security cores 1.10.13
 
Неделя науки 2013 СПбГПУ
Неделя науки 2013 СПбГПУНеделя науки 2013 СПбГПУ
Неделя науки 2013 СПбГПУ
 
Асимметричная криптография
Асимметричная криптографияАсимметричная криптография
Асимметричная криптография
 
Trojans, worms
Trojans, wormsTrojans, worms
Trojans, worms
 
Backdoors
BackdoorsBackdoors
Backdoors
 
Компьютерные вирусы
Компьютерные вирусыКомпьютерные вирусы
Компьютерные вирусы
 
Dbs prezentation
Dbs prezentationDbs prezentation
Dbs prezentation
 
презентация на защиту 06.06
презентация на защиту 06.06презентация на защиту 06.06
презентация на защиту 06.06
 

Hpc 2.26.03.2013.

  • 1. АЛ-31 для СУ-27 Двигатель для «Сухой «Суперджет» 15 лет 6 лет 50 опытных образцов 8 тестовых образцов 3.5 млрд долларов 600 млн евро
  • 2. Большинство суперкомпьютеров (список top500.org) – гетерогенные среды. CPU : GPU = 1 : n (n = 1, 2, 3,…)
  • 3. Cray Titan 29 октября 2012 18 688 AMD Opteron (16 ядер в каждом) 18688 Tesla K20X 9 МВт, 404 кв. м 20 петафлопс (1015) – 1 место
  • 4. Архитектура GPU. Технологии GPGPU. Кизько Б. А., 5085/2, ИИТ, ФГБОУ ВПО СПбГПУ 26.03.2013
  • 5. GPU Построение в реальном времени изображений по описанию трехмерных сцен
  • 6. GPU Быстрая однородная обработка большого количества элементов Аппаратная реализация основных алгоритмов Графический процессор изначально создавался как многоядерная структура (сотни ядер).
  • 7. GPU CPU vs GPU Гораздо больше транзисторов GPU отведено на обработку данных, а не на управление исполнением (т.н. Flow control)
  • 10. NVIDIA Compute Unified Device Architecture Intel Core i5 – 110 Гфлопс – 100 Вт Core 2 Duo – 19 Гфлопс - 90 Вт Tesla K20X – 3,95 Тфлопс – 225 Вт Radeon HD 7660G – 380 Гфлопс - 35 Вт
  • 11.
  • 12. GPGPU до 2007 года Шейдерные языки Cg, GLSL и HLSL GLSL – OpenGL HLSL – Microsoft DirectX 1. Широкая поддержка оборудования. 2. Отсутствие готовых библиотек. 3. Необходимо знание специализированного языка 4. Привязка к графическим API.
  • 13. GPGPU до 2007 года 5. Отсутствует возможность взаимодействия между пикселями. 6. Отсутствуют операции типа scatter – есть только gather.
  • 14. GPGPU до 2007 года 7. Приложения часто ограничены ПСП. Простой вычислительных мощностей!
  • 15. NVIDIA Compute Unified Device Architecture ноябрь 2006 г. - первый GPU с DirectX 10, GeForce 8800 GTX с архитектурой CUDA • Учѐт требований IEEE к арифметическим операциям • Набор команд, ориентированный на вычисления. Независимость от графических API • Произвольный доступ к памяти для чтения и записи • CUDA Toolkit и CUDA SDK
  • 17. NVIDIA CUDA Доступ к регистровой разделяемой памяти для обмена данными между потоками
  • 18. NVIDIA Compute Unified Device Architecture Язык программирования C с расширениями Распространѐнность GPU GeForce 8, 9, 100, 200, 300, 400, 500, 600, 700
  • 19. NVIDIA Compute Unified Device Architecture GPU – сопроцессор (device) для CPU (host) Собственная память (память устройства, device memory) Параллельная обработка множества потоков Ядро (kernel) – исполняемая над большим числом потоков функция с параллелизмом данных Отличия потоков GPU от CPU: •Для полной эффективности GPU нужны тысячи потоков •Легковесность, низкие накладные расходы на создание
  • 20. NVIDIA Compute Unified Device Architecture
  • 21. NVIDIA Compute Unified Device Architecture SIMD (Single Instruction – Multiple Data) SIMT (Single Instruction – Multiple Thread) Несколько видов памяти (регистры, локальная, разделяемая, глобальная, константная, текстурная) с разными правами доступа
  • 22. NVIDIA Compute Unified Device Architecture
  • 23. Open Compute Language Khronos Group: AMD, Intel, Motorola, Apple, NVIDIA, IBM, ARM 2008 г. - OpenCL 1.0 1 декабря 2012 г. - OpenCL 1.2 C99 с новыми ключевыми словами Открытый стандарт Широкая поддержка оборудования Прирост в WinZip 16.5 на AMD APU - 45%
  • 24. Open Compute Language CPU (host) управляет OpenCL-устройствами (devices): CPU, GPU, DSP, …
  • 25. Open Compute Language WinZip, ArcSoft, Corel VideoStudio, GIMP, Mathematica 8, vReveal, Blender, BattleField 3, … PyOpenCL, WebCL (JS-интерфейс для обработки вычислений в браузере, поддержка в Firefox и WebKit), ScalaCL, Ruby-OpenCL PGI OpenCL Compiler, OpenCL Studio, ZiiLABD OpenCL SDK http://openclnews.com/apps
  • 26. Open Compute Language AMD OpenCL University Kit Набор материалов от AMD для обучения технологии в течение семестра. 13 лекций с примерами кода и набором заданий http://developer.amd.com/resources/heterogeneous- computing/opencl-zone/
  • 27. HSA Foundation AMD, ARM, Samsung, Texas Instruments, Qualcomm, MediaTek, Imagination Technologies
  • 28. Intel Larrabee -> Xeon Phi Архитектура x86 Много ядер Pentium в одном чипе с общей памятью
  • 29. Intel Xeon Phi Сопроцессор 5110P: 60 ядер Pentium 1GHz с EM64T, 4 потока/ядро 512-бит SIMD 512К L2 1 TFLOPS 6/8 Gb GDDR5 RHEL 6.x SuSE Linux 12
  • 31. Взаимодействие NVIDIA с ВУЗами 269 университетов мира СПбГПУ, СПбГУ, "Дубна", ОИЯИ, МИЭТ, МГТУ им. Баумана, МАИ, "Курчатовский институт", МГУ им. Ломоносова, ... декабрь 2009 - научно-образовательный центр "Параллельные вычисления", Дубна
  • 32. Список источников 1. Сайты HSA Foundation, NVIDIA, AMD, Khronos Group 2. thg.ru - подробный обзор Intel Xeon Phi 3. Wikipedia 4. Статьи с habrahabr.ru 5. Сайт научно-образовательного центра "Параллельные вычисления" http://www.parallel-compute.ru/ 6. opencl.org 7. gpgpu.org 8. Результаты НИР на 3-4 курсах. Научный руководитель - Семьянов П. В.