Cyber Defense Doctrine Managing the Risk Full Applied Guide to Organizational...
Процессоры Intel® Xeon® E5-2600 v3
1. Процессоры Intel® Xeon® E5-2600 v3
Александр Мельников
Специалист по корпоративным технологиям,
Европейская Техническая Группа
Intel
2. 2
Семейство Intel® Xeon® E5-2600 v3
90%-ное повышение производительности с Intel® AVX 2^
Самый энергоэффективный серверный процессор+
Возможности управления виртуализацией с
Cache Monitoring
^Refer to Slide 14 for Source and Configuration details
+Refer to Slide 17 for Source and Configuration details
Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests are measured using
specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other
information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other
products. For more information go to http://www.intel.com/performance
3. • Node Manager 3.0
• Cache QoS Monitoring
3
Основные новшества
• Advanced Vector Extensions (AVX) 2.0
• PCPS (Per Core P-States)
• Память DDR4
• Virtual Machine Control Structure (VMCS) Shadowing
• Дедупликация
• Иерархия хранения
• Тонкие диски
• Шифрование
• Твердотельные накопители
Вычисления
• Контроллер 10/40 Gb Ethernet
• Разгрузка сетевой вирт-ции
• Flow Director
• Вирт-ция сетевых функций (NFV)
• Intel® QuickAssist® Technology
Хранени
е
Сеть
4. 4
Intel® Advanced Vector Extensions (AVX) 2.0
E5-2600 v3
(22 нм «Так»)
2012 2013 2014
Производительность ядро
Intel® AVX 1.0
2X Flops: 256-битные векторы с
плавающей запятой
E5-2600
(32 нм «Так»)
Intel®
AVX
2.0
Поддержка вычислений с
плав. запятой половинной
точности, ГСЧ
E5-2600 v2
(22 нм «Тик»)
С 2001 года:
128-битные векторы
new
• Ускорение высокопроизводительных вычислений
с плавающей запятой с помощью инструкций
Fused Multiply Add (FMA)
• 256-битные целочисленные векторные
инструкции помогают в математических задачах,
кодеках, при обработке изображений и сигналов
90%
До 90% прироста
производительност
и от поколения к
поколению
Source as of August 2014 TR#3034 on Linpack*. Baseline configuration: Intel® Server Board S2600CP with two Intel® Xeon® Processor E5-2697 v2, Intel® HT Technology
disabled, Intel® Turbo Boost Technology enabled, 8x8GB DDR3-1866, RHEL* 6.3, Intel® MKL 11.0.5, score: 528 GFlops. New configuration: Intel® Server System R2208 ВтTTYS
with two Intel® Xeon® Processor E5-2699 v3, Intel® HT Technology disabled, Intel® Turbo Boost Technology enabled, 8x16GB DDR4-2133, RHEL* 6.4, Intel® MKL 11.1.1, score:
1,012 GFlops Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark
and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to
vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when
combined with other products. For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.
5. 5
Преимущества памяти DDR4
2200
1800
1400
1000
• Развитие технологий памяти с более высокими
скоростями и плотностью, и пониженным
напряжением
• Поддержка более высоких частот памяти на
бóльших емкостях
Емкость подсистемы памяти 40%
128 GB 256 GB 384GB 512 GB 768 GB
32GB LRDIMM ON
E5-2600 v3DDR4-
2133
32GB LRDIMM ON
E5-2600 v2DDR3-
1866
До 40%
увеличения
пропускной
способности
с 3-мя DIMM на канал
Source as of August 2014 TR#3044 on STREAM (triad): Intel® Server Board S2600CP with two Intel® Xeon® Processor E5-2697 v2, 24x16GB DDR3-1866
@1066MHz DR-RDIMM, score: 58.9 GB/sec. New Configuration: Intel® Server System R2208 WTTYS with two Intel® Xeon® Processor E5-2699 v3, 24x16GB
DDR4-2133 @ 1600MHz DR-RDIMM, score: 85.2 GB/sec. Software and workloads used in performance tests may have been optimized for performance only on
Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and
functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully
evaluating your contemplated purchases, including the performance of that product when combined with other products. For more information go to
http://www.intel.com/performance
*Other names and brands may be claimed as the property of others.
6. 6
Самый энергоэффективный процессор:
Поядерные режимы P-States (PCPS) делают общий вклад в
сохранение энергии
Средняя частота/потребление на ядро
Один процессор
Одна производи-
тельность
Меньшее
потребление
PCPS Выкл
PCPS Вкл
2 4 6 8 10 12
Ядро
2 4 6 8 10 12
Ядро
24
%
До 24% снижения
потребления
питания по
сравнению с
предыдущим
поколением
Comparison based on SPECpower*_ssj2008 results published as of August 26, 2014. Sugon I620-G20 platform with two Intel® Xeon® Processor E5-2699 v3, 10,599
overall ssj_ops/watt. Source. Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance
tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those
factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including
the performance of that product when combined with other products. For more information go to http://www.intel.com/performance *Other names and brands may be
claimed as the property of others.
7. Технологии для облачных вычислений
Улучшение качества сервисов с процессорами Intel® Xeon® E5 v3
7
Сетевая виртуализация
Быстрое шифрование данных
Мониторинг Кэша
Телеметрия платформы
Этапы облаков:
• Виртуализация
• Автоматизация
• Оркестрация
VMCS Shadowing
Частное
облако
8. Мониторинг кэша обеспечивает качество
сервиса
8
Проблема: Не видно используемые
ресурсы виртуальными машинами
Решение: согласованное предоставление
сервиса
= нет больше шумного соседа!
Раньше:
Одно приложение в
многопользовательской среде использует
слишком много ресурсов
(или “проблемы шумного соседа”)
Сегодня с мониторингом кэша:
Видимость в использовании ресурсов
кэша виртуальной машиной
VM
3
VM 4
VM
1
VM
2
Использование
Кэша
VM 3
VM 4
VM 1
VM 2
Использование
Кэша
9. 9
VMCS Shadowing:
Улучшение изоляции ВМ и возможностей мониторинга
Управление/ Защита Разраб./Тест.
Поддержка старых
приложений
VM0
Current OS
Guest VMM
Root VMM
Hardware
VM1
Legacy OS
Root VMM
Hardware
VM0
Current
OS
Legacy VMM
Manage VM
Monitor for
malicious
activities
VM1
Production
Env.
Root VMM
Hardware
VM0
Production
Env.
VM2
Dev / Test
Env.
Pre-production VMM
10. • Node Manager 3.0
• Cache QoS Monitoring
10
Основные новшества
• Advanced Vector Extensions (AVX) 2.0
• PCPS (Per Core P-States)
• Память DDR4
• Virtual Machine Control Structure (VMCS) Shadowing
• Дедупликация
• Иерархия хранения
• Тонкие диски
• Шифрование
• Твердотельные накопители
Вычисления
Хранение
Сеть
• Контроллер 10/40 Gb Ethernet
• Разгрузка сетевой вирт-ции
• Flow Director
• Вирт-ция сетевых функций (NFV)
• Intel® QuickAssist® Technology
11. Трансформация СХД:
строительные блоки Intel
11
Данные для
эффективности и
отказоустойчивости
Разделение данных
по типам для
увеличения
емкости и
доступности
Cache Acceleration
Software
Enterprise Edition for
Lustre
PCIe SSDs
Развитие экосистемы
Ускорители СХД & SoC’s
СХД ПО
* Other brands and names may be claimed as the property of others.
Storage Acceleration
Library (ISA-L)
Intel® Rapid Storage
Technology enterprise
12. Виртуальный SAN:
кардинально простой гипервизор- Конвергентная СХД
12
vSphere + Virtual SAN
…
Virtual SAN Shared
Datastore
Основы:
• Програмно определяемая СХД внедрена в
vSphere
• Запускается на любых стандартных x86
серверах
• Объединяет HDD/flash в общее хранилище
• Система управления на базе политик СХД
• Высокая производительность за счет флэш
ускорения
• Высоко надежная - без потери данных в
случае аппаратных сбоев
• Глубоко интегрирована со стеком VMware
Hard disks SSD Hard disks SSD
Hard disks SSD
13. Основные преимущества Virtual SAN
Кардинальная простота
• Устанавливается в два клика
• Управляется из клиента
vSphere
• Управление на основе политик
• Глубоко интегрирована со
стеком VMware
Высокая
производительность
• Интегрирована в ядро vSphere
• Флэш-ускорение
• Подбирает плотность VDI всего
флэш массива
• Лучшая
Цена/Производительность
Низкая Стоимость Владения
• Устраняет большие стартовые
инвестиции (CAPEX)
• Растет вместе с вами (OPEX)
• Гибкий выбор стандартного
оборудования
• Не требует специальных навыков
13
14. Значительно снижается задержка при
шифровании
реализовано за счет улучшенных инструкций Intel® AES-NI
2
1,5
1
0,5
0
Скорость передачи шифрованных данных
E5-2600 v2 E5-2600 v3
AES-GCM
14
2x
До 2X
Выросла
скорость
Source as of June 2014 on AES-128-GCM Encryption algorithm: Intel internal measurements using Aztec City platform with two E5-2658 v3, DDR4-2133, CentoOS v3.8.4, Open SSL v1.0.2-beta1. Baseline
Configuration: Intel internal measurements with two E5-2658 v2, DDR3-1866, CentoOS v3.8.4, Open SSL v1.0.2-beta1. Software and workloads used in performance tests may have been optimized for performance
only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those
factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined
with other products. For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.
15. • Node Manager 3.0
• Cache QoS Monitoring
15
Основные новшества
• Advanced Vector Extensions (AVX) 2.0
• PCPS (Per Core P-States)
• Память DDR4
• Virtual Machine Control Structure (VMCS) Shadowing
• Дедупликация
• Иерархия хранения
• Тонкие диски
• Шифрование
• Твердотельные накопители
Вычисления
Хранение
Сеть
• Контроллер 10/40 Gb Ethernet
• Разгрузка сетевой вирт-ции
• Flow Director
• Вирт-ция сетевых функций (NFV)
• Intel® QuickAssist® Technology
16. 10GbE / 40GbE создан для E5 v3
Отличительные особенность Intel® Ethernet CNA XL710
• Новое поколение 10 / 40 GbE – спроектировано для
использования в облачных средах
• Программно определяемая инфраструктура – разгрузка
сетевой виртуализации, Intel® Ethernet Flow director для
управления трафиком
• Виртуализация сетевых функций (NFV) – высокая
производительность на маленьких пакетах, Intel® DPDK
Проверенные
Валидация платформ
Драйверы Intel
30 лет – «Just Works»
Гибкие
Конверг.: LAN / SAN
Интерфейсы: 2x40, 1x40,
Производительные
Созданы для программно определяемой
инфраструктуры SDI
4x10, 2x10
Виртуализация: VMDq, SR-IOV,
Flow Director,
оптимизирован для DPDK
17. Ускорение виртуальных оверлейных сетей
Производительность VXLAN Overlay
25%
Более 25% увеличения
пропускной способности
1 x 40 GbE
Пропускная 39 Гбит/с
@ 11% загрузка CPU
4 x 10 GbE LAG
Пропускная 31 Гбит/с
@ 52% загрузка CPU
78%
До 78% снижения
нагрузки на CPU
Контроллер
Ethernet
без механизма
UDP RSS для
VXLAN
4 x 10 GbE LAG
Пропускная 4 Гбит/с
@ 5% загрузка CPU
Source Intel Arch Lab Aug 2014 1: Test Configuration SUT1 2x Xeon E5-2697 v2 (2.7ГГц, 24c) 128GB, 8-ch, DDR3, 1600MHz 2x Intel X520, ixgbe 3.21.2 Ubuntu x64, kernel v3.11, SUT2: 2x
Xeon E5-2699 v3 (2.3ГГц, 14c) 128GB, 8-ch, DDR4, 2133MHz Intel Ethernet CNA XL710, i40e 1.0.15 Linux x64, kernel v3.15.6, Netperf 2.6 default settings running on 4 VNIs with 8 threads each
Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are
measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other
information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products.
For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.
18. Intel® Ethernet Flow Director
Снижение
латентности
19
Из-за уменьшеного
переключения контекста
~3x RPS
Более чем в три раза memcached
Запросов В Секунду (RPS)1
Received Side Scaling ONLY Intel® Ethernet Flow Director
App
App
Core1
Core0
Context Switch
Core1
Intel® Data Direct I/O (Intel® DDIO) Intel® Data Direct I/O (Intel® DDIO)
Linux* OS Linux* OS
Non Intel Ethernet
Controller
Hardware Queues
Intel Ethernet
Controller XL710
Hardware Queues
Rx1
Queue
Rx0
Queue
Flow Flow
No Flow to Core Alignment Intelligent Flow to Core Alignment
Source Intel Arch Lab Aug 2014 1: Test Configuration Memcached v1.4.20, 48 or 64 thr 12 Clients, Mcblaster Record Size = 64 Bytes (TCP) Number of keys = 1,000,000 Threads per client (-t) = 24 Connections per
thread (-c) = 1 Nagles Disabled, SUT1 2M RPS – RSS and 5.6M RPS – Flow Director: 2x Xeon E5-2697 v2 (2.7GHz, 24c) 128GB, 8-ch, DDR3, 1600MHz Intel X520, ixgbe 3.21.2 RHEL 7.0 x64, optimized kernel
v3.10, SUT2 7.6M RPS – Flow Director: 2x Xeon E5-2699 v3 (2.3GHz, 36c) 128GB, 8-ch, DDR4, 2133MHz Intel Ethernet CNA XL710, i40e 1.0.15 RHEL 7.0 x64, optimized kernel v3.10
Performance tests and ratings are measured using specific computer systems and/or components and reflect the approximate performance of Intel products as measured by those tests. Any difference in system
hardware or software design or configuration may affect actual performance. Buyers should consult other sources of information to evaluate the performance of systems or components they are considering
purchasing. For more information on performance tests and on the performance of Intel products, visit http://www.intel.com/performance/resources/benchmark_limitations.htm.
19. Intel® Ethernet Flow Director
Снижение
латентности
20
Received Side Scaling ONLY Intel® Ethernet Flow Director
App App
App App App App
App App App App App
App App App App App App
App App App App App
Intel® Data Direct I/O (Intel® DDIO) Intel® Data Direct I/O (Intel® DDIO)
Linux* OS Linux* OS
Non Intel Ethernet Controller Hardware Queues Intel Ethernet Controller XL710 Hardware Queues
No Flow to Core Alignment Intelligent Flow to Core Alignment
Из-за уменьшеного
переключения контекста
~3x RPS
Более чем в три раза memcached
Запросов В Секунду (RPS)1
Source Intel Arch Lab Aug 2014 1: Test Configuration Memcached v1.4.20, 48 or 64 thr 12 Clients, Mcblaster Record Size = 64 Bytes (TCP) Number of keys = 1,000,000 Threads per client (-t) = 24
Connections per thread (-c) = 1 Nagles Disabled, SUT1 2M RPS – RSS and 5.6M RPS – Flow Director: 2x Xeon E5-2697 v2 (2.7GHz, 24c) 128GB, 8-ch, DDR3, 1600MHz Intel X520, ixgbe 3.21.2 RHEL 7.0
x64, optimized kernel v3.10, SUT2 7.6M RPS – Flow Director: 2x Xeon E5-2699 v3 (2.3GHz, 36c) 128GB, 8-ch, DDR4, 2133MHz Intel Ethernet CNA XL710, i40e 1.0.15 RHEL 7.0 x64, optimized kernel v3.10
Performance tests and ratings are measured using specific computer systems and/or components and reflect the approximate performance of Intel products as measured by those tests. Any difference in
system hardware or software design or configuration may affect actual performance. Buyers should consult other sources of information to evaluate the performance of systems or components they are
considering purchasing. For more information on performance tests and on the performance of Intel products, visit http://www.intel.com/performance/resources/benchmark_limitations.htm.
20. Процессоры
Intel® Xeon® E5-2600 v3
Процессор Intel® Xeon®,
SSD диски Intel и ПО
Контроллеры и
адаптеры Intel® 40
Gb Ethernet
21
Intel® Xeon® E5 v3: выигрышная комбинация
комплексного подхода
Вычисления
Сеть
Хранение