2. Концепция программного решения
• 1. Особенности и преимущества графических процессоров как новой
перспективной технологии.
• 2. Задачи и целевая аудитория GPUDigitalLab.
• 3. Новизна проекта (отличия от конкурентов, технологические
особенности в той мере, в какой они могут быть поняты аудиторией
презентации).
• 4. Квантово-химические расчёты как приложение, хорошо
иллюстрирующее особенности и преимущества проекта.
• 5. Возможности коммерциализации как проекта GPUDigitalLab в целом,
так и квантово-химического приложения в частности.
3. Графические процессоры – инструмент для
научно-технических дисциплин
• Современные графические процессоры представляют собой
высокопроизводительные системы для параллельных вычислений
общего назначения, не имеющие даже близких аналогов по
соотношению производительности и цены.
4. Сравнение современных параллельных
архитектур
Архитектура Цена
Частота
ГГц
Число
ядер
FLOP
на ядро
GFLOPS
32(64)-бит
ПСП
ГБ/с
CPU AMD Opteron
6180 SE
57000 р. 2.50 12 2x4 2x4 42.7
GPU AMD Radeon
HD 6990
20000 р. 0.83 2x1536 2
5099
(1277)
320
STI
PowerXCell 8i
QS20:
$10000
3.2 2x8 2x4
410
(205)
25.6
ClearSpeed e710
(2 x CSX700)
$3570 0.25 2x192 1
96
(96)
8.5
MD3-PCIX
(2 x MDGRAPE-3)
$16000 0.25 40 33 330 ** –
5. Пояснение к указанным в таблице данным
• параллельная по данным архитектура графических процессоров (GPU) хорошо
масштабируется, поэтому допускает большее число скалярных ядер (максимум на
данный момент – 1600 на одном чипе) и обеспечивает наилучшее соотношение
цена/производительность;
• широкая шина памяти GPU обеспечивает 8-кратное преимущество в ПСП;
• перепрошивка игровой приставки Sony PlayStation3 открывает доступ к
программированию встроенных в нее CPU Cell BE [100] и GPU NVIDIA G71 (24
пиксельных конвейера, 550 МГц, 106 GFLOPS);
• сопроцессор ClearSpeed [101] способен выполнять операции плавающей арифметики
двойной точности без потери производительности;
• сопроцессор MDGRAPE ([102], [103]), в отличие от остальных, узкоспециализирован
для задач молекулярной динамики и практически не доступен за пределами Японии
(где он и был разработан).
6. Сравнение производительности
CPU и GPU Intel vs AMD
Общие:
число транзисторов: удвоение каждые 18 месяцев (+60% за год);
технологический процесс: уменьшение в 2 раза каждые 46 месяцев (–17% за год);
CPU:
МТП: удвоение каждые 24 месяца (+42% за год);
ПСП: удвоение каждые 26 месяцев (+38% за год);
GPU:
МТП: удвоение каждые 12 месяцев (+102% за год);
ПСП: удвоение каждые 22 месяца (+45% за год).
Здесь МТП – максимальная теоретическая производительность (увеличивается с количеством скалярных вычислительных
блоков и их частотой), ПСП – пропускная способность памяти (увеличивается с шириной шины и ее частотой).
7. Препятствия широкому использованию
графических процессоро в научной сфере
Несмотря на преимущества графических процессоров, их использование
для научных и технологических вычислений по-прежнему ограничено.
Приложения для расчётов на GPU создаются в разрозненных научных
группах для решения конкретных задач, тогда как попыток разработки
коммерческих продуктов для широкого использования обычно не
предпринимается. Одной из причин такого положения является отсутствие
стандартных инструментов для интегрированной разработки
вычислительных ядер (с использованием GPU), пользовательского
интерфейса и средств удалённого доступа к данным и расчётам.
8. Основная цель нашего проекта
Цель проекта GPU Digital Lab – создание многофункциональной платформы,
предоставляющей широкому кругу пользователей и программистов доступ к
высокопроизводительным параллельным вычислениям на графических процессорах.
Серверная часть платформы будет обеспечивать функционирование расширяемой
системы расчетных модулей, решающих актуальные задачи математического
моделирования и визуализации, а также обеспечивать «облачный» доступ клиентов к этим
модулям и данным. Используя вычислительные возможности системы, пользователи
смогут создавать собственные мультимедийные продукты, работающие на основе
клиентской части.
9. Создаваемый программно-аппаратный
комплекс, в частности, обеспечит:
• формирование расширяемой системы (библиотеки) расчетных модулей,
требующих высокой производительности вычислений для решения
сложных задач (математического моделирования, визуализации) на
современном научно-техническом уровне;
• выполнение необходимых расчетов на высокопроизводительных
серверах, осуществляющих поточно-параллельные вычисления общего
назначения на графических процессорах;
• «облачный» доступ пользователей системы а к исходным данным,
расчетным модулям и результатам вычислений.
10. Основные потребители программного решения
• Ориентирован продукт будет на использование научно-
исследовательскими группами и коммерческими организациями,
заинтересованными в высокопроизводительных расчетах,
мультимедийном представлении наукоёмких данных, совместном
«облачном» доступе экспертов к процессу и результатам вычислений.
• Область применения системы – математическое моделирование
физических, физико-химических, биологических, финансовых,
социальных и других процессов и систем. Клиентами могут быть научно-
исследовательские группы и организации, медицинские и
образовательные учреждения, коммерческие организации, связанные с
наукоёмкими технологиями, правительственные организации.
11. Новизна программного решения
• Технологическая и научная новизна проекта заключается в уникальном
сочетании таких составляющих, как:
• высокопроизводительные поточно-параллельные вычисления на
графических процессорах;
• расширяемая модульная система программ (ядер, «движков»),
решающих вычислительные задачи;
• «облачный» доступ клиентов сервиса к вычислительным процессам,
данным и результатам;
12. Структура программного решения
• Продукт представляет собой программно-аппаратную платформу, которая
включает в себя ядро параллельных вычислений на основе Microsoft
DirectCompute и Visual C++. Операционная система для серверной части -
Microsoft Windows Server 2012, клиентской части - Microsoft Windows 8 или
другие ОС. Среда разработки - Microsoft Visual Studio 2013 (язык системы Visual
C++). Видео обработка реализована основе движка Microsoft Media Foundation.
• Ядро платформы представляет собой процедуру запуска и обработки событий.
При запуске этого ядра создаются домены для работы программных модулей. В
начале работы программный модуль загружается в домен и ожидает действий
пользователя. При выполнении операции на вычисление или визуализацию
каких-либо данных модуль подает сигнал основному ядру, отвечающемут за
контроль над выполняемыми операциями.
13. Серверная Часть системы
• Серверная часть системы предназначена для выполнения на рабочей
станции, в составе которой может быть как много (количество не
ограничено) высокопроизводительных графических процессоров NVIDIA
и AMD, так и один графический процессор. Клиентская часть
поддерживает широкий спектр недорогих рабочих станций и мобильных
устройств, все популярные операционные системы.
14. Бизнес-модель проекта
• Система может работать по принципу интернет-магазина. Пользователю
будет достаточно зайти в свой личный кабинет, выбрать задачу,
загрузить исходные данные, оплатить операцию и получить результат
работы в своей клиентской части. На данный момент предусмотрены
два типа лицензий: "Физическое Лицо","Юридическое Лицо". Для
юридического лица предоставляется набор ключей для выдачи
сотрудникам с помощью которого, они получают доступ к функционалу.
Фирма оплачивает аренду мощностей системы на определенный
период, и для каждого сотрудника вычисляется текущий баланс. Также
мы планируем использовать данное решение для запуска дальнейших
программных продуктов. Мы рассматриваем привлечение инвестиций от
заказчиков на разработку новых расчетных модулей для расширения
системы.
15. Применение технологии GPUDigitalLab – проект
DMOL3(квантовая химия)
В качестве одного из высокопроизводительных приложений, работающих
на создаваемой программно-аппаратной платформе, мы представляем
модуль квантовохимических расчётов (не хочу называть его Dmol’ом в
комерческой работе, так как это название имеет своих авторов и хозяев).
16. Соответствие квантовохимического модуля
целям и технологии проекта
Современная задача, востребованная широким кругом специалистов;
Универсальный алгоритм, позволяющий без существенных модификаций
моделировать очень многие системы.
Математическая модель, хорошо иллюстрирующая преимущества
графических процессоров: объём вычислений очень быстро возрастает с
увеличением размера исследуемых систем, однако эти расчёты хорошо
распараллеливаются и масштабируются.
17. Квантово-химические модели и вычислительные
методики:
• Методы самосогласованного поля, локальной электронной плотности
(SCF, LDA).
• Линейные комбинации атомных орбиталей (ЛКАО, LCAO).
• Пространственное интегрирование с использованием квадратур
Лебедева.
18. Рассчитываемые параметры
• Энергии образования и связи молекул и соединений
• Межмолекулярные силы
• Конфигурации атомов в молекулах, кристаллах и других системах,
размеры которых ограничены только производительностью вычислений
• Пространственное распределение электронной плотности (и заряда)
• Частоты колебаний частиц
19. Моделируемые Системы
• Кристаллы, жидкости, жидкие кристаллы
• Поверхности
• Газы
• Молекулы и молекулярные комплексы, включая большие органические
молекулы и молекулярные кристаллы
20. Области применения
• Органическая и неорганическая химия, фармацевтика
• Материаловедение
• Молекулярно-динамическое, стохастическое и статическое
моделирование методами частиц
21. Примеры исследуемых процессов
• Катализ
• Полимеризация
• Упорядочение и разупорядочение кристаллов
• Явления переноса в различных средах
• Взаимодействия газ – поверхность
• Формирование оксидных (и других) плёнок
22. Необходимое для запуска проекта
оборудования
• Сервер для хранения данных gpudigitallab
• РАБОЧИЕ СТАНЦИИ ПРОГРАММИСТОВ
• Рабочие станции дизайнеров
• МОБИЛЬНЫЕ УСТРОЙСТВА С ОПЕРАЦИОННОЙ СИСТЕМОЙ
WINDOWS RT
• Сенсор Microsoft Kinect
• Leap motion
• ПЛАЗМЕННАЯ ПАНЕЛЬ
23. Технологии, используемые в проеке
Microsoft VISUAL Studio 2013 (c++, c#)
MICROSOFT Direct3d 11.1
Microsoft DIRECTCOMPUTE
Microsoft Media Foundation SDK
MICROSOFT WINDOWS DRIVER KIT
MICROSOFT azure
MICROSOFT SQL SERVER 2015
Microsoft asp.net
MICROSOFT WCF
NVIDIA PhysX
24. Участники Проекта GPUDigitalLab
• Губанов Олег Игоревич (технический директор ООО «Аксиома»,
бакалавр технических наук Aberystwyth University – главный разработчик)
• Кирилл Александрович Некрасов( доцент кафедры технической физики
УРФУ – научный консультант)
• Гаврилов Илья Валерьевич – (сотрудник лаборатории антивозрастных
технологий ИМКТ)
• Лукаш Вячеслав Александрович (доцент кафедры биохимии УГМУ)
25. Стратегия развития проекта
I. ПАРТНЕРСКИЕ СОГЛАШЕНИЯ С НАУЧНЫМИ ОРГАНИЗАЦИИ
I. Институт медицинских клеточных технологий
II. ФИЗИКО-ТЕХНИЧЕСКИЙ ФАКУЛЬТЕТ УРФУ
III. Aberystwyth UNIVERSITY
IV. Bangor university
II. Выход компании на мировой рынок
I. ПРИВЛЕЧЕНИЕ СРЕДСТВ ОТ ВЕНЧУРНОГО ФОНДА MICRSOSOFT
VENTURES
II. Привлечение средств В РАМКАХ ПРОГРАММЫ GPU VENTURES PROGRAM
III. ЗАКЛЮЧЕНИЕ ПАРТНЕРСКОГО СОГЛАШЕНИЯ С MICROSOFT Сorporation
IV. Заключение партнерского соглашение с NVIDIA Corporation
V. заключение партнерского соглашения с Intel
VI. Заключение партнерского соглашения с AMD
26. Welcome to the World of GPU Computing and
Modern Science