Блог командыNeoCAT(решение, которое анализирует риски безопасности и уязвимости облачных ресурсов).
Определение RTO (Recovery Time Objective) и RPO (Recovery Point Objective) играет важную роль в разработке плана восстановления после сбоя или форс-мажорной ситуации. Они определяют стратегии и процедуры восстановления, позволяющие минимизировать простой системы и потерю данных. При расчете RTO и RPO должны индивидуально учитываться для каждой компании особенности бизнес-процессов и связанные с ними риски.
RTO — это максимальное время, в течение которого ваша инфраструктура может быть недоступна, прежде чем это повлияет на бизнес. В некоторых отраслях требуется практически нулевое время простоя, чтобы предотвратить критические потери в бизнесе.
RPO — это максимально допустимый период времени, за который могут быть потеряны данные в случае сбоя. RPO зависит от частоты резервного копирования и объемом копируемых данных.
RTO и RPO — два показателя, взаимосвязанные между собой и рассчитываются исходя из потребностей бизнеса. Если компании требуется круглосуточный доступ к своей инфраструктуре, то RTO должен быть близким к нулю. В случае аварийной ситуации восстановление системы будет максимально оперативным и быстрым.
Однако есть компании, которым важно сохранить как можно больше ценных данных и сформировать эффективную их защиту при форс-мажоре. В таком случае рассчитывается RPO, обеспечивающий минимальные потери данных при аварийной ситуации.
Нужно понимать, что чем ниже допустимые значения RTO и RPO, тем более высокий уровень защиты системы, который требует больших финансовых вложений.
Расчеты RTO и RPO
RTO
Определение оптимальных сроков восстановления начинается с углубленного анализа рисков и последствий для бизнеса, в ходе которого изучаются бизнес-процессы компании.
После глубокого изучения требований к системам группа аналитиков определяет оптимальное RTO. RTO, который предполагает, что система реанимируется менее чем через час, требует значительных инвестиций, поэтому не устанавливайте слишком низкие RTO. Приемлемые значения RTO существенно различаются в зависимости от критичности и роли затронутой системы.
Например, критически важная ERP-система может иметь RTO от 5 минут до часа, а внутренний сайт может иметь RTO 24 часа и более.
RPO
Это значение определяется как интервал времени для создания копий данных. Чтобы определить это значение, необходимо изучить и ввести в практику защиты систем технологию резервного копирования. О стратегии резервного копирования мы подробно рассказывали в предыдущей статье.
Качественное построение алгоритма системы резервного копирования включает пять основных этапов:
анализ инфраструктуры;
определение требований к поставщику услуг и оборудованию;
выбор поставщика услуг резервного копирования;
развертывание самой системы.
Когда будет проведен анализ инфраструктуры и выбран поставщик услуг резервного копирования, тогда можно производить расчет RPO исходя из полученных данных.
Для расчета RPO используются четыре наиболее распространенных временных интервала:
Непрерывные или нулевые RPO: наборы данных, которые дублируются непрерывно в режиме реального времени.
От 1 до 4 часов: этот временной интервал является стандартным для полукритических бизнес-процессов с ограниченной терпимостью к потерям.
От 4 до 12 часов: этот RPO подходит для данных, которые мало влияют на бизнес, например, базы данных статистики маркетинга или продаж.
От 13 до 24 часов: более длительные значения RPO, которые подходят для некритических данных.
Пример расчетов RTO и RPO
Медицинский центр. Предположим, в 11 часов утра в центре обработки данных происходит неожиданный сбой системы, и данные, которые вы хотите восстановить, должны как минимум откатить систему к состоянию на 10 часов утра, поэтому RPO составляет 1 час. Чтобы гарантировать стабильность медицинского онлайн-сервиса, вам нужно убедиться, что все приложения снова вернутся к работе за 30 минут, поэтому RTO составляет 30 минут.
Поддержка бизнес-процессов на бесперебойной основе – это идеальные цели, к которым стремятся все компании, заинтересованные в развитии своего предприятия. Тем не менее необходимо иметь в виду, что установленные целевые показатели RTO и RPO не являются универсальными для всех организаций. Если достижение этих показателей нереалистично, то такие расчеты могут сильно ударить по вашему бизнесу во время аварийных ситуаций.