このポッドキャストでは、Tintri のフィールド最高技術責任者 (CTO) である Shawn Meyers とともに、スナップショットとデータ保護戦略におけるスナップショットの役割について説明します。
スナップショットの定義方法、スナップショットが作成されるインフラストラクチャのレベル、スナップショットがバックアップではない理由、スナップショットの粒度がリカバリ パフォーマンスに及ぼす影響、目標復旧時点 (RPO)、および目標復旧時間 (RTO) について説明します。
マイヤーズ氏は、データベースでの使用などのスナップショットの制限や、データ増大への影響についても語っています。
Antony Adshead: スナップショットとその利点と制限とは何ですか?
ショーン・マイヤーズ: スナップショットに関しては、どのレベルで撮影するかを考慮する必要があるということです。
スナップショットは基本的に、データ ポイントの特定時点のコレクションです。 つまり、OS (オペレーティング システム)、VM (仮想マシン)、ストレージ レベルなど、さまざまなレベルでこれを行うことができます。
これは、特定の時点のコレクションであり、過去にロールバックしたり、その時点に復元したりできます。
この点については、必ず明確にしておきます。スナップショットはバックアップではありません。 スナップショットをバックアップとして使用している人がいます。 スナップショットはツールボックスに追加したり、復元したりできるものですが、バックアップでは特定の時間枠を見つけるためにロールフォワードやロールバックができるため、決してバックアップではありません。 スナップショットは、特定の定義された時点です。
スナップショットを実行するにはさまざまな方法があり、使用しているストレージ テクノロジによって異なります。 私が話したい最も素晴らしいことは、1 つのボリューム上のすべてが同時にスナップされる LUN (論理ユニット番号) またはボリューム スナップショットを作成することになるということです。 また、より小規模なサブセットのコレクションである場合は、VM ごとまたはオブジェクトごとのスナップショットになります。
スナップショットの粒度が高いほど、影響を受けるものの観点から見ると、より広範な保護プロセスであるより広範なスナップショットよりも回復間隔が長くなります。
ストレージでは、データを別のサイトにレプリケートするなど、レプリケーションにスナップショットをよく使用する傾向があるため、スナップショットを作成し、それをレプリケートします。 ロールバックして回復できるスナップショットがまだ残っています。
ショーン・マイヤーズ、ティントリ
もちろん制限はあります。 データベースのほとんどはロック状態になるため、トランザクション ログによるロールフォワードやロールバックはできません。
また、データの増加。 それが最も大きなことの 1 つです。 変更を加えるとデータが増加するスナップショットがあります。 書き込まれたブロックがあり、スナップショットを取得し、再度書き込み、別のスナップショットを再度取得すると、すべてのデータが保存されます。
これは、制限という点で最も大きなことの 1 つであり、スナップショットからのデータの増加に注意を払い、スナップショットが細分化されるほど、ストレージへの影響が少なくなります。 したがって、スナップショットの幅が広いほど影響は大きくなりますが、スナップショットが粒度が高いほど影響は小さくなります。
Adshead: スナップショットのベスト プラクティスは何ですか?また、スナップショットは包括的なデータ保護戦略にどのように適合しますか?
マイヤーズ: スナップショットはあらゆるデータ保護戦略の一部である必要があります。 そして当然、振り出しに戻らなければならないということになります。
RPO (目標復旧時点) と RTO (目標復旧時間) に戻ります。 私たちは座ってそれらを理解し、そのニーズを満たすために当社のテクノロジーがスナップショットとどのように連携するかを理解します。
他の場所に保存されているデータも考慮する必要があります。 また、現在はバックアップにスナップショットを使用することが多いため、運用への影響も心配する必要があります。
そこで、スナップショットを取得し、そのスナップショットをバックアップ システムに添付して、そこでバックアップを実行します。 そうすれば、そのバックアップが実稼働システムのパフォーマンスに影響を与えることはありません。
レプリケーションと同じです。 スナップショットを作成し、バックサイドでレプリケーションを実行するため、アクティブなデータはレプリケートされないため、運用システムでは影響を受けません。
スナップショットの最も優れた点の 1 つは、OS レベルから離れたストレージ層で物事をオフロードできるため、本番環境を実行しているときに本番環境に影響が及ばないことです。
もちろん、いつ回復する必要があるかを知っています。つまり、回復ポイントについて話します。 どのくらいのデータが失われる可能性があるのか、どのくらいのデータが必要なのか、どれくらいの速さでオンラインに戻る必要があるのか。 私はいつもこれをノブのようなものだと表現しています。好きなところまで回すと、面白いことにノブを回して RPO と RTO が小さくなり、コストが上昇する傾向があります。
したがって、プロセスを減らしたり、RPO や RTO を長くしたりしてもコストは下がります。 1 分未満、あるいは 1 秒未満になると、コストは成層圏のように上昇し、より高価になるように思えます。
結局のところ、戦略を設計し、どれだけの資金を持っていて、何ができるかを把握することが重要です。 または、何が欲しいのか、そしてそれにどれくらいの費用がかかるのかを把握します。 行ったり来たりして、メリットとデメリットを比較検討する必要があります。 他のすべてのことと同様、データ戦略にどれだけの資金を投資するかは組織のビジネス上の決定であるためです。
私は過去にコンサルタントとして長い間働いており、データセンターを失った企業と仕事をしてきましたが、データ保護戦略に対する考え方や取り組みは、大規模なデータ損失を一度も経験したことがない企業とは異なります。
心配すべきことは常にあります。データ損失の問題が一度もなかったのなら、それは単に幸運であることを意味します。 それは将来のある時点で起こることになるため、データ保護戦略に必ず時間を費やすようにしてください。
私にとって、スナップショットは最も重要な部分の 1 つであり、それをどのように行うか、データをどこに保存するか、頻度、そして回復プロセスがどのようなものかを知るために役立ちます。
スナップショットの最大の利点の 1 つは、回復時間です。 バックアップを使用している場合、多くの場合、スピンバックする必要があり、再水和するのに時間がかかります。 スナップショットを使用すると、通常、そのオブジェクト、その VM が何であれ、数秒ではなくても数分で回復し、システムを元の状態に戻して、RTO プロセスを再び下げることができます。