Катастрофоустойчивость, RTO и RPO

Катастрофоустойчивость — способность информационной системы противостоять авариям, затрагивающим существенную часть инфраструктуры. Например длительные перерывы в электроснабжении офиса, пожар в дата-центре (центре обработки данных, ЦОД) и т.д. В случае любых катаклизмов, в том числе в случае невозможности или затруднения доступа в офисные помещения, как это произошло в случае пандемии вируса COVID-19 должен быть сохранён (или как минимум быстро восстановлен) основные бизнес-процессы компании

RTO и RPO — важные параметры катастрофоустойчивости, которые как раз и определяют на сколько быстро система может восстановиться.

RTO (Recovery Time Objective) — Целевое время восстановления. Время — необходимое для восстановления основных бизнес-процессов компании после катастрофического нарушения работоспособности системы.

Для разных видов катастроф RTO может быть разным. Для примера в таблице приведены типовые значения RTO для серверов, которые вы можете арендовать в наших дата-центрах:

Вид катастрофы RTO Примечание
Аварии в офисе заказчика 5 минут Время необходимое для настройки удаленного доступа на любом компьютере/планшете/телефоне в любой точке мира
Аварии в основном ЦОД 10 минут Время перезапуска серверов в резервном дата-центре
Полная недоступность Интернет 3-5 часов Время физической доставки носителей из резервного ЦОД по Москве + время копирования

RPO (Recovery Point Objective) — Целевая точка восстановления. Интервал времени отстоящий в прошлое от момента катастрофы определяющий, как много времени работы будет потеряно после восстановления. (Например если авария произошла в 16:00, а последняя доступная резервная копия доступна на 12:00 — значит RPO будет равен 4 часа).

Для разных видов катастроф RPO также может быть различным. Для примера в таблице приведены типовые значения RPO для серверов, которые вы можете арендовать в наших дата-центрах:

Вид катастрофы RTO Примечание
Аварии в офисе заказчика 0 минут При любых авариях в офисе — работа дата-центра не нарушается и информация сохраняется
Аварии в основном ЦОД 2-20 минут Резервные копии всех наших серверов делаются каждые 10 минут, однако последняя резервная копия на момент катастрофы может быть еще не полностью передана в резервный ЦОД.
Полная недоступность Интернет 3-5 часов Время физической доставки носителей информации из резервного ЦОД по Москве + время копирования