ハリケーン、人的ミス、サイバー攻撃、ランサムウェア攻撃など、災害はいつでも起こり得ます。ITチームは、ダウンタイムを最小限に抑えて重要なアプリケーションやオペレーションを迅速にリストアできるようにすることで、こうしたリスクによる影響を緩和する災害復旧 (DR) 計画を策定します。この計画には通常、復旧までの時間と許容できるデータ損失の量のしきい値の両方が含まれます。これらは、復旧するまでの時間で測定されます。
堅牢な災害復旧の一環として、現実的な目標復旧時間 (RTO) と目標復旧時点 (RPO) が事業継続の保証に役立ちます。計画内のRTOは、中断されたアプリケーションやサービスの運用が再開されるまでの時間を表します。基本的に、これは災害後にITや事業活動が復旧するまでの目標時間です。RPOは、災害やシステム障害の際にビジネスに深刻な害を及ぼすことなく損失を許容できるデータの量、もしくは再入力や再構築が必要となるデータの量を表します。この場合、RPOは災害前に実施した最終バックアップの時間から計算します。ビジネスにとって、RTOとRPOが低いことが理想です。
企業は、目標復旧時間と目標復旧時点 (RTO/RPO) の指標によってITレジリエンスを評価することができます。
これらの指標は災害復旧計画において極めて重要です。RTOは障害発生から修復までの時間のことで、システム、アプリケーション、ネットワークが再び機能するまでに許容できる最長の時間を指します。これは、システム障害、ランサムウェアやその他のサイバー脅威による停止、自然災害、人的ミスを含みます。
同様に、RPOは急な障害から最終バックアップまでの時間のことで、ビジネス体験に重大な害を出さずに、破壊的な出来事から最終バックアップまでで組織が許容できるデータ損失の最大量を指します。RPOも時間で測定します。
組織は顧客満足度と従業員満足度を高く保つため、RPOとRTOをできる限り低くしたいと考えます。
どの企業のDR計画でも重要なことは、目標復旧時間 (RTO) が、インシデント後にアプリケーションがオフラインでいられる組織が同意した最長の時間であるということです。
デジタルビジネスは動きが速いため、チームは通常、アプリケーション、サービス、データのデジタル機能をリストアするまでに許容できる上限の時間として、日単位ではなく、秒、分、時単位でRTOを測定します。
パンデミックによって、オンラインのショッピングサイトで新規顧客が増えました。小売業者がこうした顧客を満足させ続けるには、多数のeコマースシステムで目標RTOを、秒単位などに設定する必要があります。これは、小売業者の決済システムがダウンした場合、ITチームはわずか2、3秒で稼働状態に戻さなければならないということです。
RTOについて詳しく見る目標復旧時点 (RPO) とは、ビジネスに悪影響を及ぼさないままアプリケーションが耐えられる、データ損失の最大量のことです。バックアップによってデータをリストア可能な時点が決まるため、RPOは組織のバックアップインフラのスケジュールと信頼性に依存します。
従業員の生産性、顧客ロイヤルティ、EUの一般データ保護規則といった規制に基づくコンプライアンス報告に悪影響を及ぼすため、企業によるデータ損失の管理はますます難しくなっています。組織の中心事業によって異なりますが、秒、分、時、場合によっては日単位で時間を計測するRPOは、データの最終バックアップからシステム停止までの経過時間を追跡します。
例えば、医療機関では多くの場合、現在の患者情報にアクセスできるよう定期的なデータのバックアップが望まれます。システムの停止が発生した場合、直近のデータのバックアップが1時間前のものであれば、RPOは1時間です。
RPOについて詳しく見るどちらも時間に基づく指標ですが、RTOとRPOでは異なる目標を測定します。RTOは、災害後にデジタルアプリやサービスが停止しても許容できる最長の時間のことです。RPOは、バックアップ間で企業に悪影響を及ぼさないまま、デジタルアプリやサービスが許容できるデータ損失の最大量のことです。これらは別の測定値のため、一方の指標がもう一方より高い、あるいは低い必要はありませんが、バックアップの頻度を決める上でRPO指標は重要です。
RPOとRTOは重要な災害復旧指標であるだけでなく、デジタルビジネスでの成功はアプリとサービスに大きく依存するため、重要なビジネス目標にもなりつつあります。RTOとRPOがDRにとって重要な指標なのは、以下が理由です:
災害が発生した場合、壊滅的な結果を招くことなくどれくらいの時間とデータ損失に耐えられるのか、組織は前もって把握しておかなければなりません。システム停止前に十分な余裕を持ってRTOとRPOを計算することで、データと評判を現実的に守るためのガイドラインが得られます。
デジタルビジネスにとってアプリは生命線です。そのため、自然災害やサイバー攻撃に遭った場合、どのアプリを優先すべきかをチームが把握しておかなければなりません。RTOとRPOが効率的であれば、チームは事業継続性を維持することができます。
ITチームは、業務部門やパートナーに対して一定のシステム稼働時間や品質を確保するという約束が守れるよう、RTOとRPO指標の目標を計算します。
RTOを計算するには、ビジネスがどのくらいシステム停止を許容できるのかを判断しなければなりません。RTO指標を計算する場合、組織は以下を確認します:
RPOは時間 (秒、分、時) で計算されますが、ビジネスに害を与えないままアプリケーションが損失を許容できる最大のデータ量のことです。チームがRPOを計算する際は、通常以下の点を考慮します:
DR計画を策定、管理する上ではどちらの指標も重要ですが、RPO指標とRTO指標は相関関係にある必要はないという点に注意が必要です。例えば、RTOが3時間でRPOが10秒、RTOが30分でRPOが24時間、といった設定もできます。
データの損失によって重大な業務の中断が発生し、ビジネスの破綻を引き起こすこともあります。以下は、組織がRTOとRPO目標達成のために使用する一般的なバックアップの種類です:
3-2-1バックアップを実施する組織は、バックアップのために少なくとも3つのデータコピーを作成します。コピーのうち2つはオンサイト (種類の異なるメディア) に、1つはオフサイトに保管されます。これにより、ミッションクリティカルなデータに対する単一障害点を防止し、事業継続性の向上に役立ちます。
また、他のシステムや外部からのマウントに決して露出されないバックアップデータのゴールドコピーである、イミュータブルなスナップショットを使ってDR計画を強化することもできます。
クラウドバックアップに投資する組織は、データを複製してクラウドに保管することで何らかの障害が発生した際のデータの安全性とアクセシビリティを確保し、データを損失や破損から守ります。クラウドバックアップはBackup as a Service (BaaS) と同義語で、セルフマネージドまたはプロバイダーによるフルマネージドのいずれかで実施できます。また、復旧先としてパブリッククラウドを活用し、as a Serviceの消費モデルでフェイルオーバーとフェイルバックを行うDisaster Recovery as a Service (DRaaS) を投資することもできます。
チームがハイブリッドクラウドバックアップを選択する場合、通常はひとつのデータセキュリティとデータ管理プラットフォームを使ってクラウドとオンサイト環境全体のアプリとワークロードを保護します。
今日のデジタルカスタマーは要求が厳しく、製品やサービスを利用できない、またはこれらが満足に提供されない場合、他の選択肢に切り替えても構わないと思っています。このため、多くの企業が自社の災害復旧 (DR) 計画を再評価し、目標復旧時間 (RTO) と目標復旧時点 (RPO) ができる限りゼロに近づけようとしています。数時間や数日ではなく、数分、数秒となるのが理想的なシナリオです。
しかし、レガシーのデータ保護やDR製品に多額の投資をしても、ダウンタイムを阻止することはできませんでした。阻止できたものもあったかもしれませんが、結果として収益とブランドに対する信用を失い、生産性が低下し、コンプライアンス違反の罰金を受けることになりました。RTOやRPOの削減にこれらと同じレガシーのソリューションを使おうとすると、組織のDR戦略は失敗します。
Cohesityでは、AIを活用したデータセキュリティとデータ管理を提供しています。Cohesityは、データセンター、エッジ、クラウドにわたるデータのセキュリティ確保、保護、管理を容易にし、データから簡単に価値を引き出せるようにします。イミュータブルバックアップスナップショット、AIベースの脅威検知、悪意ある行為の監視、迅速かつ大規模な復旧といった包括的なデータセキュリティとデータ管理機能で組織がサイバーセキュリティの脅威に対抗し、事業継続性とサイバーレジリエンスを高められるようにします。Cohesity Data Cloudは、ターゲットストレージ、バックアップ、レプリケーション、災害復旧、クラウドの階層化を含むデータ保護インフラをエンドツーエンドで一元化し、攻撃対象領域を狭めてコストを下げ、リスクを最小化します。さらにCohesityは、AI/MLを活用したインサイトと、ダウンタイムに繋がるランサムウェアやその他内外の脅威から守るゼロトラストセキュリティで運用を効率化します。