Java Performance

Java Performance

Подготовил: Артем Жданов.

Agenda

Теория
– Классические ошибки
– Выбор метрик
– Способы улучшения производительности
Пример
– Workflow система
– Проблемы и решения

У меня все медленно!

Что делать?

Первый шаг
«я вижу, что метод foo() реализован неэффективно»
«по профайлеру видно, что метод bar() – горячий и занимает
5%»
«по-моему, у нас тормозит БД, и нужно перейти с DB 1 на DB 2"
Правильный первый шаг:
1. Выбрать метрику
– ops/sec, transactions/sec
– время исполнения
– время отклика
2. Убедиться в корректности метрики
– релевантна (учитывает реальный сценарий работы приложения)
– повторяема

Метрики
Throughput, Bandwidth. Количество работы, выполненное за
единицу времени:
• MB/sec
• ops/sec, transactions/sec
• FPS frames per second
Время...
• ...работы
• Execution time: общее время исполнения
• ...отклика
• Latency: время отдельной операции
• Response time: задержка между стимулом и реакцией
• ...запуска
• Startup time: время до начала работы
• Time to performance: время до начала хорошей работы
Память

Представление метрик

“A в N раз быстрее B” означает

SpeedUp = ABS(Time(A) – Time(B)) / Time(B);

Как ускорить. Основные шаги

Что мешает работать быстрее?
– Делаем эксперименты и проверяем метрики на проблемных местах
Где это находиться?
– Делаем и проверяем предположение с помощью profiler tools
Как это исправить?
– Итеративный подход

Что можно улучшить
Уровень системы
– I/O (Сеть/Диск)
– Операционная система
– Процессор/память
Уровень JVM
– Издержки работы самой JVM
– Время GC
Уровень приложения
– Количество потоков (мало или даже много)
– Лишние блокировки, синхронизация
– Алгоритмические проблемы (лишние вызовы, неэффективные структуры
данных и алгоритмы)
Архитектурный уровень
– Кеширование
– Распределение нагрузки на нескольких узлов
– Оптимизация взаимодействия между слоями

Система распределённых вычислений
Требования
– Workflow system

Система распределённых вычислений

Требования
Большой объем Read-Only data

Data read distribution
Read only HSQL MySQL Oracle

7%

17%

16% 60%

Архитектурные ЗА и ПРОТИВ
Кешируем RO
– Как распределять кеш между нодами?
– Как контролировать размер кеша?
– Как узнать на сколько эффективен кеш?
– Если через 5 секунд ситуация изменилась?
– Как организовать кеш локально?
Обрабатываем ивенты параллельно
– Сколько потоков создать?
– А если 2 потока начнут обработку одного
ивента?
– Как узнать на сколько эффективно
добавление еще одного потока?
– Если через 5 секунд ситуация изменилась?

Решения
Ранжируем данные в кеше по полезности
– Что полезнее закешировать таблицу Users или Books?
Измеряем производительность системы
– Какую взять метрику?
Используем данные измерений что бы изменить
критерии
– Стало лучше на 5%, это хорошо?
– Стало лучше в 3000 раз, WTF?
2 стратегии измерения
– Application-based
– System-based

System-based

Метрика - events/sec
Может лучше System.nanoTime();?
Какой будет overhead?
Что делать при параллельном исполнении?

Application-based

Метрика уже другая - выполненная работа
Overhead правда чуть выше
Параллельное исполнение - не проблема
Когда подход не будет работать?

Java Performance

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Java Performance

Similar to Java Performance (20)

More from Alex Tumanoff

More from Alex Tumanoff (20)

Java Performance