Управление миллионами метрик таит в себе множество сложностей. Это вопросы автоматизации, масштабируемости, интеграции с другими системами и многое другое. Хочется максимально всё автоматизировать — один раз настроил и забыл. Возможно ли это?
Я подробно расскажу о накопленном практическом опыте использования Zabbix в самых жестоких условиях различных сценариев, расскажу на реальных примерах о том, как справиться с мониторингом тысяч удалённых точек, как не заблудиться в десятках миллионов триггеров и осилить динамические среды. Тут и о производительности нужно серьёзно задуматься.
Zabbix обладает целым набором функциональности, которая позволяет упростить жизнь отдела мониторинга. Конечно, подробности можно найти в документации, только не всегда понятно, как это правильно использовать.
Цель доклада — поделиться практическим опытом, это бесценно!
8. Zabbix агент?
Минусы
- Установка
Плюсы
+ Доступ к любым метрикам доступным OS
+ Гибкость на уровне коммуникаций (пассивные и активные проверки)
+ Очень маленький и быстрый, нет влияния на саму систему
+ Легко расширить функциональность модулями и скриптами
…много ещё…
9. Zabbix агент?
Минусы
- Установка
Плюсы
+ Доступ к любым метрикам OS
+ Гибкость на уровне коммуникаций (пассивные и активные проверки)
+ Очень маленький и быстрый, нет влияния на саму систему
+ Легко расширить функциональность модулями и скриптами
…много ещё…
12. Анализ в режиме
реального времени
Метрики
CPU load
Free disk space
WEB server state
Триггеры
CPU load > 5
Free disk space < 10%
WEB server state = 0 (down)
18. Шаблон - это набор
параметров для мониторинга
Linux сервер? Используем Template Linux
Процессор, диски, сеть, память
MySQL? Используем Template MySQL
Доступность, TPS, статус репликации
19. Шаблон - это набор
параметров для мониторинга
Linux сервер? Используем Template Linux
Процессор, диски, сеть, память
MySQL? Используем Template MySQL
Доступность, TPS, статус репликации
22. Одинаковые, но разные
Linux серверы
/
/data
/tmp
/
/tmp
/
/home
/data
/tmp
Template Linux 1
Template Linux 2
Template Linux 3
Сервер 1
Сервер 2
Сервер 3
54. Проще, чем кажется
Обратная совместимость с агентами
Но не с прокси!
Автоматическое обновление структуры базы
Таблицы с историей не трогаем
Не ломаем API
57. Итог
Не надо бояться
200.000 хостов
6.000.000 метрик, 20.000.000 триггеров
Терабайты истории
11.000 прокси
Автоматизация и HA
Не забываем о выборе правильного железа для Zabbix
58. Итог
Не надо бояться
200.000 хостов
6.000.000 метрик, 20.000.000 триггеров
Терабайты истории
11.000 прокси
Автоматизация и HA
Не забываем о выборе правильного железа для Zabbix