Comprendre le rôle du RTO et du RPO dans les scénarios de reprise après sinistre

hero-banner

Une catastrophe (ouragan, erreur humaine, cyberattaque ou attaque par ransomware) peut survenir à tout moment. Les équipes informatiques conçoivent des plans de reprise après sinistre pour atténuer l’impact de ces risques en minimisant les temps d’arrêt et en s’assurant de pouvoir restaurer rapidement les applications et opérations critiques. Ces plans incluent généralement le délai et la quantité de données qu’il est acceptable de perdre. Ce seuil est mesuré en temps passé avant que la restauration ne soit effective.

Dans le cadre d’un plan de reprise après sinistre solide, un objectif de délai de restauration (RTO, Recovery Time Objective) et un objectif de point de restauration (RPO, Recovery Point Objective) réalistes permettent d’assurer la continuité de l’activité. Dans le plan, le RTO représente le moment où l’application ou le service perturbé sera à nouveau opérationnel. Il s’agit essentiellement d’un délai cible fixé pour restaurer les activités informatiques et commerciales après un sinistre. Le RPO représente la quantité de données qu’il est possible de perdre ou qu’il faudra réintroduire ou reconstruire en cas de sinistre ou de défaillance du système, sans que cela ne cause de préjudice important à l’entreprise. Dans ce cas, le RPO correspondrait au temps écoulé entre la dernière sauvegarde effectuée par l’entreprise et le sinistre. Les entreprises ont intérêt à avoir des RTO et des RPO faibles.

Explication des concepts de RTO et de RPO

Les entreprises peuvent évaluer la résilience de leur informatique à l'aide des métriques RTO (objectif de temps de récupération) et RPO (objectif de point de récupération).

Ces métriques sont essentielles pour planifier la reprise après sinistre. Le RTO correspond au délai entre la défaillance et la réparation, c'est-à-dire la durée maximale acceptable pour rétablir les systèmes, les applications ou les réseaux. Il peut s'agir d'une défaillance du système, d'une panne causée par un ransomware ou d'autres cybermenaces, d'une catastrophe naturelle ou d'une erreur humaine.

Le RPO, quant à lui, correspond au temps qui sépare l'incident de la dernière sauvegarde, c'est-à-dire la quantité maximale acceptable de données qu'une entreprise peut tolérer de perdre entre l’événement perturbateur et la dernière sauvegarde avant que cela ne lui cause un préjudice important. Le RPO se mesure lui aussi en temps.

Les entreprises veulent réduire au maximum leurs RPO et RTO afin de satisfaire au mieux leurs clients et leurs employés.

Qu'est-ce qu’un objectif de délai de récupération (RTO) ?

L'objectif de délai de restauration (RTO) est un élément important de tout plan de reprise après sinistre. Il correspond à la durée maximale convenue par l’entreprise pendant laquelle une application peut rester hors ligne après un incident.

Les entreprises numériques évoluent rapidement, donc les équipes mesurent généralement le RTO en secondes, minutes et heures, plutôt qu'en jours. Cela correspond au délai maximum acceptable pour restaurer les fonctionnalités numériques d'une application, d'un service ou d'une donnée.

La pandémie a poussé de nouveaux consommateurs vers les sites d'achat en ligne. Pour que les détaillants puissent satisfaire ces clients, les RTO cibles de leurs systèmes d’e-commerces, par exemple, doivent être de quelques secondes. Cela signifie que l'équipe informatique du commerçant n'a que deux ou trois secondes pour rétablir un système de paiement qui tomberait en panne.

Plus d'informations sur le RTO
rto

Qu'est-ce qu'un objectif de point de restauration (RPO) ?

Un objectif de point de restauration (RPO) est la quantité maximale de données qu'une application peut tolérer de perdre avant que l'entreprise n'en subisse les conséquences. Le RPO dépend du planning et de la fiabilité de l'infrastructure de sauvegarde d'une entreprise, car les sauvegardes déterminent à quel point dans le temps les données peuvent être restaurées.

Les entreprises ont de plus en plus de difficultés à gérer les pertes de données car elles ont des répercussions négatives sur la productivité des employés, la fidélisation des clients et la création des rapports de conformité prévus par les réglementations telles que le Règlement général sur la protection des données (RGPD) de l'Union européenne. Le RPO (qui se mesure en secondes, minutes, heures, voire jours) dépend de l'activité principale de l'entreprise et correspond à la période écoulée entre la dernière sauvegarde des données et l'interruption de l'activité.

Une entreprise de santé, par exemple, voudra probablement sauvegarder régulièrement ses données pour pouvoir accéder aux informations actuelles sur ses patients. En cas de panne, si la dernière sauvegarde de données remonte à une heure, le RPO est d'une heure.

Plus d’informations sur le RPO
what-is-rpo

Quelle est la différence entre RPO et RTO ?

Bien que le RTO et le RPO soient deux métriques basées sur le temps, ils mesurent des objectifs différents. Le RTO est le temps maximum tolérable pendant lequel une application ou un service numérique peut être indisponible après un sinistre. Le RPO est la quantité maximale de données qu'une application ou un service numérique peut tolérer de perdre entre deux sauvegardes avant que cela n'ait un impact négatif sur l'entreprise. Comme ce sont des mesures distinctes, il n'est pas nécessaire qu'une métrique soit supérieure ou inférieure à l'autre. La métrique RPO est toutefois cruciale pour déterminer la fréquence des sauvegardes.

rpo-rto diff

Pourquoi le RTO et le RPO sont-ils des métriques importantes pour la reprise après sinistre ?

Le RPO et le RTO sont à la fois des métriques clés de la reprise après sinistre et des objectifs commerciaux essentiels, car le succès des entreprises numériques dépend de la haute disponibilité de leurs applications et de leurs services. Le RTO et le RPO sont des métriques importantes pour la reprise après sinistre, car :

boost-data

Ils rendent la planification des données et de la reprise après sinistre plus efficace.

Les entreprises doivent savoir à l'avance combien de temps et de données elles peuvent tolérer de perdre avant de se retrouver dans une situation catastrophique. Calculer le RTO et le RPO bien en amont d’une panne donne aux entreprises des lignes directrices qui leur permettent de protéger leurs données et leur réputation de manière réaliste.

indentify-and-protect

Ils permettent aux équipes d'identifier et de protéger rapidement les applications de niveau 1.

Les applications sont vitales pour les entreprises numériques. Les équipes doivent donc impérativement savoir lesquelles privilégier cas de catastrophe naturelle ou de cyberattaque. Des temps de RTO et de RPO efficaces permettent aux équipes de maintenir la continuité de l'activité.

SLAs

Ils permettent aux professionnels du secteur et de l’IT d’établir des SLA.

Les équipes informatiques calculent les RTO et RPO pour s’assurer qu'elles pourront tenir leurs promesses de fournir un certain niveau de disponibilité ou de qualité aux métiers et aux partenaires.

Types courants de sauvegardes utilisées pour atteindre les objectifs de RTO et de RPO

Une perte de données peut gravement interrompre les opérations, voire entraîner la faillite de l'entreprise. Voici quelques-uns des types de sauvegardes les plus couramment utilisés par les entreprises pour atteindre leurs objectifs de RTO et de RPO :

Les entreprises qui appliquent le principe de la sauvegarde 3-2-1 créent au moins trois copies des données pour les sauvegardes. Deux copies sont stockées sur site (sur des supports différents) et la dernière est stockée hors site. Cela permet d'éviter tout point de défaillance unique pour les données stratégiques, et renforce ainsi la continuité de l'activité.

Les équipes peuvent également renforcer leurs plans de reprise après sinistre grâce aux snapshots immuables, ces copies de référence des données de sauvegarde qui ne sont jamais exposées à d'autres systèmes ni montées en externe.

Les entreprises qui investissent dans la sauvegarde cloud gardent leurs données en sécurité et peuvent y accéder en cas de perturbation en les répliquant et en les stockant sur le cloud pour les protéger contre toute perte ou corruption. Une sauvegarde cloud est synonyme de sauvegarde à la demande (BaaS), qui peut être auto-gérée ou entièrement gérée par un fournisseur. Les équipes peuvent également investir dans une reprise après sinistre à la demande (DRaaS), qui utilise le cloud public comme cible de restauration pour la bascule et le retour arrière dans un modèle de consommation à la demande.

Les équipes qui optent pour une sauvegarde du cloud hybride utilisent généralement une plateforme unique de sécurité et de gestion des données pour protéger les applications et les charges de travail dans les environnements cloud et sur site.

Cohesity et le RTO/RPO dans la reprise après sinistre

Les clients numériques d’aujourd’hui sont exigeants et enclins à changer de fournisseur si les produits et services ne sont pas disponibles et ne fonctionnent pas de manière satisfaisante. De nombreuses entreprises réévaluent donc leurs plans de reprise après sinistre afin de s’assurer que leurs objectifs de délai de restauration (RTO) et leurs objectifs de point de restauration (RPO) sont aussi proches que possible de zéro (qu’ils se comptent idéalement en minutes ou secondes, plutôt qu’en heures ou jours).

Des investissements considérables dans des produits hérités de protection des données et de reprise après sinistre n’ont pas permis de supprimer les temps d’arrêt (dont certains auraient pu être évités). Des entreprises ont ainsi perdu des revenus et la confiance dans leurs marques, ont vu leur productivité baisser et ont dû payer des pénalités financières pour non-respect de la conformité. Une stratégie de reprise après sinistre qui consiste à tenter d’utiliser ces mêmes solutions héritées pour réduire le RTO et le RPO de l’entreprise est vouée à l’échec.

Cohesity offre une sécurité et une gestion des données alimentées par l’IA. Avec Cohesity, il est facile de sécuriser, de protéger, de gérer et de valoriser les données dans le centre de données, à la périphérie et dans le cloudGrâce à ses capacités complètes de sécurité et de gestion des données, notamment des snapshots de sauvegarde immuables, une détection des menaces basée sur l’IA, la surveillance des comportements malveillants et une restauration rapide à grande échelle, Cohesity permet aux entreprises de se défendre contre les menaces de cybersécurité et renforce la continuité de l’activité ainsi que la cyber-résilience. Le Cohesity Data Cloud unifie l’infrastructure de protection des données de bout en bout (notamment le stockage cible, la sauvegarde, la réplication, la reprise après sinistre et la hiérarchisation du cloud), ce qui permet de réduire les surfaces d’attaque, de diminuer les coûts et de minimiser les risques. De plus, Cohesity rationalise les opérations grâce à des informations alimentées par l’IA/le machine learning (ML) et à une sécurité Zero Trust qui permet de se défendre contre les ransomwares et autres menaces internes et externes qui entraînent des temps d’arrêt.

Ressources

resource_pattern
Cas d’étude

Nationwide

En savoir plus
Shumaker, Loop, and Kendrick hero banner
Cas d’étude

Shumaker, Loop & Kendrick, LLP

En savoir plus
Icon ionic ios-globe

Vous êtes sur le point de visualiser du contenu en anglais, souhaitez-vous continuer ?

Ne pas afficher cet avertissement

Icon ionic ios-globe

Vous êtes sur le point de visualiser du contenu en anglais, souhaitez-vous continuer ?

Ne pas afficher cet avertissement