データレプリケーションとは
データレプリケーションとは、複数のロケーションでデータのコピーと保存を行うことでネットワーク全体でデータの可用性とアクセシビリティを改善するプロセスのことです。この結果、他のユーザーの業務を妨げることなく、ローカルユーザーがより迅速に必要なデータにアクセスできる分散環境が実現します。
データレプリケーションはシステム障害、サイバーセキュリティの侵害、その他の災害 (自然災害と人的エラーによる障害を含む) の発生時でもデータの正確な最新のコピーが常に存在することを保証するため、ディザスタリカバリ (DR) 戦略の不可欠な要素となります。
複製したデータのコピーは同じシステム内、オンサイトやオフサイトのサーバー、複数のクラウドに保存できます。
データレプリケーションが重要な理由とは
データは意思決定を促進するため、データレプリケーションが障害に強いビジネスを実現するために不可欠な要素となります。これを通じて、ミッションクリティカルなプロセス、アナリティクス、システム、さらにはビジネスに関する知見のためにデータを提供し、このような処理を改善できます。できるだけリアルタイムに近いタイミングで常にユーザーにデータを提供し、データにアクセスできるようにする必要があります。データレプリケーションを導入すると、このために役立ちます。
データレプリケーションの戦略的なアプローチがもたらすメリットとして以下が挙げられます。
- 事業継続とディザスタリカバリ (BCDR) を実現 – データをコピーし複数のマシンに保存することで、どのようなハードウェア障害、ランサムウェア攻撃、その他の災害が発生した場合でも最新バージョンのデータに常にアクセスできることを保証できます。
- アプリケーションとデータのパフォーマンスを改善 – 複数のロケーションにデータを保存することで、トランザクションがネットワークのエッジに存在している場合でも、データをユーザーやトランザクションが発生している場所のより近くに配置できるため、レイテンシーを削減できます。
- アナリティクスの機能を強化 – データウェアハウスなどの共有システムやクラウドにデータを複製すると、あらゆる場所で業務を行うアナリストが協力してプロジェクトに取り組み、より迅速により正確なビジネスインテリジェンスを実現できます。
データレプリケーションの種類とは
企業はダウンタイムのリスクを緩和するために、OracleやSQL ServerやMySQLの戦略を通じデータレプリケーションを実装します。
データレプリケーションの種類には以下があります。
- スナップショットのレプリケーション – 写真のようにある特定の時点でデータのレプリケーションを行うことです。
- トランザクションのレプリケーション – データの完全なコピーを取得し、データの更新が発生するたびに、リアルタイムで更新が発生した順序で継続的に更新データを受信します。
- データのマージまたは異なる種類のデータのレプリケーション – 2種類以上のデータソースを1つのソースに統合する場合にこのようなレプリケーションが発生します。
同期レプリケーションと非同期レプリケーションの違いとは
同期レプリケーション
プライマリサイトで新規のデータの書き込みや更新を行う際に、セカンダリサイトにデータをコピーします。このため、複数のサイトでデータの最新のコピーが存在するため、迅速なフェイルオーバーベースのディザスタリカバリが実現します。
同期レプリケーションではデータをプライマリサイトの配列にまず書き込み、その後即時にセカンダリサイトの配列に書き込みます。書き込みが完了したと見なされるのは、書き込みプロセスが両方のサイトの配列で完了した通知をホストが受信した後に限られます。同期レプリケーションではプライマリサイトとセカンダリサイトの間でデータのずれがほとんどまたはまったく発生しないものの、このプロセスがパフォーマンス全体に負荷をかけ、プライマリサイトとセカンダリサイトの距離が大きい場合は悪影響が発生することがあります。
非同期レプリケーション
データをプライマリサイトに書き込み、その後定期的に (毎時、毎日、毎週など) セカンダリサイトに複製します。セカンダリサイトでデータを更新すると、プライマリサイトにその旨通知します。
データを非同期で複製するため、ユーザーはネットワークパフォーマンスの影響が最も小さいタイミングでレプリケーションをスケジュールできます。プライマリサイトとセカンダリサイトの間でデータが完全に同期しない可能性を認識した上で、セカンダリサイトをディザスタリカバリのために使用できます
データレプリケーションのツールとは
企業はデータレプリケーションのツールを活用することで、オリジナルのソースデータのロケーションとは異なるロケーションでデータのコピーを迅速に作成できるため、リスク削減を実現できます。Cohesityのようなマルチクラウドのデータ管理とデータレプリケーションのソフトウェアを導入すると、オンプレミスとクラウドの多くのデータソースとデータターゲットの間でレプリケーションポリシーの管理を簡素化できます。
ストレージのデータレプリケーションとは
ダウンタイムのリスクを緩和するために、プライマリストレージのバックアップシステムで障害が発生した場合に、ストレージレプリケーションのソリューション、サービス、ツールが追加の冗長性を提供します。
DBMSのデータレプリケーションとは
データベースのレプリケーション (DBMSのレプリケーション) では、すべてのユーザーが同じデータにアクセスできるよう、あるデータベースから別のデータベースへの定期的なデータのコピー (SQL Server、MySQL、Oracleへのデータレプリケーションなど) を実施します。企業のデータ管理ポリシーと役割ベースのアクセスに基づき、これは1度限り実施することもあれば、繰り返し実施することもあります。通常は、ダウンタイムの際にデータを迅速に復旧できるように、ディザスタリカバリや事業継続のためにデータベースのレプリケーションを実施します。
複数のアベイラビリティゾーンでデータを複製することはできますか
はい。企業はデータレプリケーションを実行することで、異なるアベイラビリティゾーンでデータの同期スタンバイコピーを管理できます。
SAPのデータレプリケーションとは
SAP HANAでは、ソースシステムからSAP HANAデータベースにデータを移行するためにデータレプリケーションを活用できます。これを実施するには、コンソールかHANA Studioを使用します。
データレプリケーションの手法とは
データレプリケーションの最も一般的な手法として以下の3つがあります。
- 完全なテーブルのレプリケーション – データストレージのソースから別のソースにすべてのデータ (すべての既存の行、新規の行、更新済みの行など) をコピーするプロセスです。
- キーベースの増分レプリケーション – キーやインデックスをスキャンすることで更新されたデータを発見し、そのデータのみをコピーするプロセスです。
- ログベースの増分レプリケーション – このプロセスではソフトウェアがソースのログファイルをスキャンすることで、更新されたデータを発見し、ソースコピーにそのデータのみをコピーします。
Cohesityがデータレプリケーションをシンプルにする方法
現在、多くの企業がさまざまな複数の製品を使用してデータレプリケーションを行っています。このようにさまざまなレガシー製品を組み合わせて活用すると、管理が困難で複雑な環境が生まれます。複雑さが増すと、ダウンタイム、レイテンシー、データ損失、総保有コスト (TCO) が増大します。
さらに、大量データの断片化とばらばらのアーキテクチャにより、24時間365日の運用要件を満たせなくなります。
Cohesityはデータレプリケーションのプロセスをシンプルにし、厳しい基準を満たすための戦略構築に取り組む企業をサポートします。Cohesityのデータ管理プラットフォームを導入すると、以下を実現できます。
- 誤って削除したファイル、アプリケーションのクラッシュ、データの破損、ウィルスからデータを保護
- 個々のファイルとアプリケーションへの迅速で低レイテンシーのアクセスを実現
- オフサイトでのデータの保護と信頼性の高いディザスタリカバリを実現
- データストアの容量の増大に合わせてニーズを満たせるよう、シームレスに拡張
- バックアップスケジュール、サービスレベルアグリーメント (SLA)、その他のデータレプリケーションパラメーターに関するポリシーを簡単に設定
Cohesityはエンドツーエンドのデータ保護インフラを統合することで、従来のデータレプリケーションの複雑さを排除する業界唯一の拡張性の非常に高い統合プラットフォームを提供します。このプラットフォームには、レプリケーションに加え、ターゲットストレージ、バックアップ、DR、クラウド階層化が含まれます。
イノベーションを促進するため、Cohesityはグローバル重複排除、スケールアウトアーキテクチャ、統合データ保護、ネイティブクラウド統合のメリットを組み合わせたソリューションを提供します。その結果、Cohesityは、エンドツーエンドのデータレプリケーション環境、そして、完全なデータ管理環境もシンプルに実現し、より低いTCOで、迅速なSLAを提供することができます。