5. • Для магазина с оборотом в 300
миллионов рублей в год один час
даунтайма стоит 34 тысячи рублей
• Регулярная недоступность сайта и
долгое время ответа приводят к
снижению позиции сайта в поисковых
системах
• Снижается лояльность постоянных
пользователей
• Снижается рейтинг сайта в рекламных
системах
Цена простоя
8. • Медицинская инфраструктура: надежность хостинга,
архитектура, резервирование
• Опыт персонала: культура разработки, навыки
поддержки, навыки администрирования
• Образ жизни: количество и скорость изменений на
проекте, взаимодействие с внешним миром
Отказоустойчивость
10. • Реселлер или собственный хостинг?
реселлер - плохо
• Аренда дата-центра или собственный дата-центр?
аренда – не очень хорошо
• Виртуальные или «железные» серверы
виртуализация – не всегда хорошо
• Географическое распределение дата-центров
возможность взять резервный сервер в другом
дата-центре - хорошо
Хостинг
11. • Защита от DDOS? Поведение в случае крупного DDOS?
«вытаскивают шнур» – надо позаботится о защите
• Доступность KVM, время замены оборудования в случае
аварии, время установки нового сервера
• Часы работы и время реакции поддержки хостинга
Хостинг
12. • Есть ли резервная площадка? Как поддерживается ее
актуальность?
Online-синхронизация файлов, базы данных
• Когда последний раз проверялся «резерв» в бою?
• Насколько связан резервный дата-центр с основным
дата-центром?
• Каким образом будет осуществляться переключение на
резервную площадку в случае аварии?
Резервирование
13. • Резерв – это не бэкап, как часто ведется резервное
копирование?
• Куда сохраняются резервные копии, изолирована ли
площадка с резервными копиями от основной
площадки?
• Как быстро можно восстановиться из резервной копии?
Какое максимальное количество данных может быть
потеряно в случае утраты данных на основной
площадке?
• Когда последний раз проверяли бэкап?
Бэкап
14. • Упавший сайт не всегда означает упавший сервер,
ведется ли мониторинг доступности бизнес-функций?
• Насколько изолирован мониторинг от основной
площадки?
• Кто и каким образом узнает о падении сайта/сервера,
как быстро?
• Мониторинг должен сообщать о приближении аварии, а
не о том, что она произошла.
Мониторинг
16. • Используется ли система контроля версий?
Есть ли версия проекта для разработки и тестирования?
Как быстро можно «откатиться» в случае аварии?
• Какой опыт у разработчиков? Прежде всего – опыт
эксплуатации запущенного проекта.
• Соблюдается ли культура разработки?
• Ведется ли документация?
• Насколько доступны разработчики?
Разработка
17. • Кто занимается системным администрированием проекта?
Насколько доступны эти люди?
• Есть ли опыт эксплуатации сложных проектов?
• Есть ли опыт разработки? Опыт взаимодействия с
разработчиками?
Администраторы
19. • Большинство аварий происходят из-за человеческого
фактора.
• Как часто происходят изменения? Можно ли «откатить»
систему на предыдущую версию в случае аварии?
• Если «падать» совсем нельзя – сохраняется ли резервная
копия с предыдущей версией?
• В идеальном мире любые изменения делаются
«инкрементально».
Изменения на сайте
20. • Проводится ли нагрузочное тестирование?
Есть ли понимание перспектив роста?
• Первые крупные рассылки практически наверняка
пройдут с авариями.
• Есть ли возможность остановить маркетинговую
кампанию? Если нет – надо максимально подготовиться.
Маркетинговые кампании