Статьи

Расчет RTO и RPO

Блог команды NeoCAT (решение, которое анализирует риски безопасности и уязвимости облачных ресурсов).

Определение RTO (Recovery Time Objective) и RPO (Recovery Point Objective) играет важную роль в разработке плана восстановления после сбоя или форс-мажорной ситуации. Они определяют стратегии и процедуры восстановления, позволяющие минимизировать простой системы и потерю данных. При расчете RTO и RPO должны индивидуально учитываться для каждой компании особенности бизнес-процессов и связанные с ними риски.

RTO — это максимальное время, в течение которого ваша инфраструктура может быть недоступна, прежде чем это повлияет на бизнес. В некоторых отраслях требуется практически нулевое время простоя, чтобы предотвратить критические потери в бизнесе.

RPO — это максимально допустимый период времени, за который могут быть потеряны данные в случае сбоя. RPO зависит от частоты резервного копирования и объемом копируемых данных.

RTO и RPO — два показателя, взаимосвязанные между собой и рассчитываются исходя из потребностей бизнеса. Если компании требуется круглосуточный доступ к своей инфраструктуре, то RTO должен быть близким к нулю. В случае аварийной ситуации восстановление системы будет максимально оперативным и быстрым.

Однако есть компании, которым важно сохранить как можно больше ценных данных и сформировать эффективную их защиту при форс-мажоре. В таком случае рассчитывается RPO, обеспечивающий минимальные потери данных при аварийной ситуации.

Нужно понимать, что чем ниже допустимые значения RTO и RPO, тем более высокий уровень защиты системы, который требует больших финансовых вложений.

Расчеты RTO и RPO

RTO

Определение оптимальных сроков восстановления начинается с углубленного анализа рисков и последствий для бизнеса, в ходе которого изучаются бизнес-процессы компании.

После глубокого изучения требований к системам группа аналитиков определяет оптимальное RTO. RTO, который предполагает, что система реанимируется менее чем через час, требует значительных инвестиций, поэтому не устанавливайте слишком низкие RTO. Приемлемые значения RTO существенно различаются в зависимости от критичности и роли затронутой системы.

Например, критически важная ERP-система может иметь RTO от 5 минут до часа, а внутренний сайт может иметь RTO 24 часа и более.



RPO

Это значение определяется как интервал времени для создания копий данных. Чтобы определить это значение, необходимо изучить и ввести в практику защиты систем технологию резервного копирования. О стратегии резервного копирования мы подробно рассказывали в предыдущей статье.

Качественное построение алгоритма системы резервного копирования включает пять основных этапов:

  • анализ инфраструктуры;
  • определение требований к поставщику услуг и оборудованию;
  • выбор поставщика услуг резервного копирования;
  • развертывание самой системы.

Когда будет проведен анализ инфраструктуры и выбран поставщик услуг резервного копирования, тогда можно производить расчет RPO исходя из полученных данных.

Для расчета RPO используются четыре наиболее распространенных временных интервала:

  • Непрерывные или нулевые RPO: наборы данных, которые дублируются непрерывно в режиме реального времени.

  • От 1 до 4 часов: этот временной интервал является стандартным для полукритических бизнес-процессов с ограниченной терпимостью к потерям.

  • От 4 до 12 часов: этот RPO подходит для данных, которые мало влияют на бизнес, например, базы данных статистики маркетинга или продаж.

  • От 13 до 24 часов: более длительные значения RPO, которые подходят для некритических данных.



Пример расчетов RTO и RPO

Медицинский центр. Предположим, в 11 часов утра в центре обработки данных происходит неожиданный сбой системы, и данные, которые вы хотите восстановить, должны как минимум откатить систему к состоянию на 10 часов утра, поэтому RPO составляет 1 час. Чтобы гарантировать стабильность медицинского онлайн-сервиса, вам нужно убедиться, что все приложения снова вернутся к работе за 30 минут, поэтому RTO составляет 30 минут.

Поддержка бизнес-процессов на бесперебойной основе – это идеальные цели, к которым стремятся все компании, заинтересованные в развитии своего предприятия. Тем не менее необходимо иметь в виду, что установленные целевые показатели RTO и RPO не являются универсальными для всех организаций. Если достижение этих показателей нереалистично, то такие расчеты могут сильно ударить по вашему бизнесу во время аварийных ситуаций.

RTO и RPO необходимо уделить как можно больше ресурсов, а также обратить внимание на формирование качественных стратегий защиты и восстановления вашей инфраструктуры.


Присоединяйтесь к сообществу облачной безопасности:
VK | Telegram