SlideShare ist ein Scribd-Unternehmen logo
1 von 103
Downloaden Sie, um offline zu lesen
Мониторинг
XXI век
Алиса Смирнова,
Дима Никоненко,
Женя Бурнаев
Группа нагрузочного тестирования
Highload++, Москва, 25-26 октября 2010 года
Поговорим про
мониторинги
План
1. Пороговый мониторинг vs Хороший
2. Оглянемся вокруг
3. Математические методы для мониторинга
4. Подробно рассмотрим повседневную
задачу
5. Проведем аналогии
6. Общий подход к построению хорошего
мониторинга
7. Примеры использования
1. Пороговый мониторинг vs
Хороший
2. Оглянемся вокруг
3. Математические методы для мониторинга
4. Рассмотрим повседневную задачу
5. Проведем аналогии
6. Общий подход к построению хорошего
Пороговый
мониторинг
Звенит, когда уже
все сломалось
Хороший
мониторинг
Звенит, когда еще
не сломалось...
...но скоро сломается
Можно успеть
принять меры
Пороговый
мониторинг
Срабатывает при
каждом
пересечении
Хороший
мониторинг
Срабатывает один
раз и по делу
Нет ложных
тревог!
Как найти
хороший
мониторинг?
1. Пороговый мониторинг vs Хороший
2. Оглянемся вокруг
3. Математические методы для мониторинга
4. Рассмотрим повседневную задачу
5. Проведем аналогии
6. Общий подход к построению хорошего
мониторинга
7. Примеры использования
В медицине -
мониторинг
эпидемий
В навигации -
мониторинг
неисправностей
датчиков
В технике -
мониторинг
износа деталей
В экономике -
мониторинг
трендов
А еще...
...мониторинг
сейсмоактивности
Давным-давно...
Но сейчас...
Глобальная система...
...из тысяч сейсмографов
Сейсмоактивность
— это случайный
процесс
Нужен тонкий
инструмент
Чтобы было
просто
Данные
  Система
мониторинга
Сигнал тревоги
И надежно
Точность
Быстрота
В сейсмологии такая
система уже есть
В ее основе —
умная математика
полувековой
выдержки
1. Пороговый мониторинг vs Хороший
2. Оглянемся вокруг
3. Математические методы для
мониторинга
4. Рассмотрим повседневную задачу
5. Проведем аналогии
6. Общий подход к построению хорошего
мониторинга
А подробнее
Существуют общие математические методы:
— Контрольные карты (Shewhart W.A., 1931);
— Метод кумулятивных сумм (Page E.S., 1954);
— Метод экспоненциально взвешенного скользящего
  среднего (Roberts S.W., 1959);
— Фильтр Калмана (Kalman R.E., 1960);
— Байесовские методы (Girshick M.A., Rubin H., 1952;
  Ширяев А.Н., 1961);
— Процедура Ширяева-Робертса (Ширяев А.Н., 1961;
  Roberts S.W., 1966);
— Метод на основе обобщенного отношения
  правдоподобия (Willsky A.S., 1976).
Из чего они
возникли?
Пуассоновский процесс
А решается она так:
Много формул.
1. Пороговый мониторинг vs Хороший
2. Оглянемся вокруг
3. Математические методы для мониторинга
4. Рассмотрим повседневную
задачу
5. Проведем аналогии
6. Общий подход к построению хорошего
мониторинга
7. Примеры использования
Пороговый мониторинг
Хороший мониторинг
И стало вот так
Как применить для
мониторинга любого
Интернет-сервиса?
1. Пороговый мониторинг vs Хороший
2. Оглянемся вокруг
3. Математические методы для мониторинга
4. Рассмотрим повседневную задачу
5. Проведем аналогии
6. Общий подход к построению хорошего
мониторинга
7. Примеры использования
Современные методы
— Асимптотически оптимальные методы (на основе
  обобщенного отношения правдоподобия) выявления
  разладки в случае нескольких каналов наблюдений
  (Никифоров 2000, 2003; Тартаковский, Розовский
  2006, 2008).
— Оптимальные методы обнаружения разладки для
  случая платы за получение новых наблюдений
  (Ширяев, 2010)
— Методы обнаружения разладки для процессов со
  скачками (Пешкир, Ширяев, 2000).
— Методы обнаружения разладки для диффузионных
  процессов (Гапеев, Ширяев, 2009)
От теории — к
практике
1. Пороговый мониторинг vs Хороший
2. Оглянемся вокруг
3. Математические методы для мониторинга
4. Рассмотрим повседневную задачу
5. Проведем аналогии
6. Общий подход к построению
хорошего мониторинга
7. Примеры
Все сервисы
разные
Постановка задачи
Что мониторить?
Что считать
разладкой?
Какой должна быть
—Точность обнаружения
—Вероятность ложного срабатывания
Сбор данных
Предобработка...
...слияние данных из
разных источников
...выделение циклов
...нормировка
Эксперименты
Подбор параметров
Настройка сигналов
о разладке
Автоматизация
Оценка результата
Радость!
2. Оглянемся вокруг
3. Математические методы для мониторинга
4. Рассмотрим повседневную задачу
5. Проведем аналогии
6. Общий подход к построению хорошего
мониторинга
7. Примеры
Лунапарк
Автоматическое выявление разладок
Автоматическое выявление разладок
Автоматическое выявление разладок
   При анализе используется время ответа,
       HTTP- и сетевые коды ответов

     Обучение на 500 размеченных тестах

   Точность обнаружения разладки около 97%
  при вероятности ложного срабатывания <1%
Мониторинг
продакшн-кластера
Атаки на систему
авторизации
Не только “да/
нет”...
...но и масштаб
проблемы
Умный мониторинг
— Математически доказанная
  эффективность;
— Масштабируемость;
— Гибкость настройки.
Вопросы?
Алиса Смирнова,
Дима Никоненко,
Женя Бурнаев
Группа нагрузочного
тестирования

119021, Россия, Москва,
ул. Льва Толстого, д. 16

+7 (495) 739-00-00
+7 (495) 739-70-70 — факс

zero@yandex-team.ru

nikonenko@yandex-team.ru
Мониторинг XXI век (Алиса Смирнова, Дима Никоненко, Женя Бурнаев)

Weitere ähnliche Inhalte

Mehr von Ontico

One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...Ontico
 
Масштабируя DNS / Артем Гавриченков (Qrator Labs)
Масштабируя DNS / Артем Гавриченков (Qrator Labs)Масштабируя DNS / Артем Гавриченков (Qrator Labs)
Масштабируя DNS / Артем Гавриченков (Qrator Labs)Ontico
 
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)Ontico
 
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...Ontico
 
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...Ontico
 
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)Ontico
 
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...Ontico
 
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...Ontico
 
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)Ontico
 
MySQL Replication — Advanced Features / Петр Зайцев (Percona)
MySQL Replication — Advanced Features / Петр Зайцев (Percona)MySQL Replication — Advanced Features / Петр Зайцев (Percona)
MySQL Replication — Advanced Features / Петр Зайцев (Percona)Ontico
 
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...Ontico
 
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...Ontico
 
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...Ontico
 
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)Ontico
 
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)Ontico
 
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)Ontico
 
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)Ontico
 
100500 способов кэширования в Oracle Database или как достичь максимальной ск...
100500 способов кэширования в Oracle Database или как достичь максимальной ск...100500 способов кэширования в Oracle Database или как достичь максимальной ск...
100500 способов кэширования в Oracle Database или как достичь максимальной ск...Ontico
 
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...Ontico
 
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...Ontico
 

Mehr von Ontico (20)

One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
 
Масштабируя DNS / Артем Гавриченков (Qrator Labs)
Масштабируя DNS / Артем Гавриченков (Qrator Labs)Масштабируя DNS / Артем Гавриченков (Qrator Labs)
Масштабируя DNS / Артем Гавриченков (Qrator Labs)
 
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
 
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
 
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
 
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
 
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
 
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
 
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
 
MySQL Replication — Advanced Features / Петр Зайцев (Percona)
MySQL Replication — Advanced Features / Петр Зайцев (Percona)MySQL Replication — Advanced Features / Петр Зайцев (Percona)
MySQL Replication — Advanced Features / Петр Зайцев (Percona)
 
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
 
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
 
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
 
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
 
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
 
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
 
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
 
100500 способов кэширования в Oracle Database или как достичь максимальной ск...
100500 способов кэширования в Oracle Database или как достичь максимальной ск...100500 способов кэширования в Oracle Database или как достичь максимальной ск...
100500 способов кэширования в Oracle Database или как достичь максимальной ск...
 
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
 
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...
 

Мониторинг XXI век (Алиса Смирнова, Дима Никоненко, Женя Бурнаев)