RDRS を使用した Azure へのメインフレーム データとミッドレンジ データのレプリケーション

Azure Database Migration service
Azure Functions
Azure Logic Apps
Azure SQL データベース
Azure Storage

Rocket® Data Replicate and Sync (RDRS) (旧称 tcVISION) は、Rocket Software が開発したデータ レプリケーション ソリューションです。 RDRS では、一部の Azure データ プラットフォーム サービスで、メインフレーム データ レプリケーション、データ同期、データ移行、および変更データ キャプチャ (CDC) のための IBM メインフレーム統合ソリューションを利用できます。

Architecture

メインフレームを Azure データ プラットフォームに移行するためのデータフローのアーキテクチャ図。

このアーキテクチャの Visio ファイルをダウンロードします。

ワークフロー

  1. RDRS データ レプリケーション ソリューションでは、IBM Db2、IBM Information Management System (IMS) DB、Adabas for Software AG、CA Datacom、CA IDMS (Computer Associates Integrated Data Management System) など、多数のメインフレームベース データベースの CDC がサポートされています。 RDRS には、レコード レベルで変更データをキャプチャするためのログベースの CDC エージェントが用意されています。 このログ ベースの CDC では、運用ソース データベースにわずかなオーバーヘッドが発生します。

  2. RDRS では、仮想ストレージ アクセス方式 (VSAM) のファイルの CDC がサポートされています。

  3. タスクはメインフレームで開始されます。 開始されたタスク (STC) は、RDRS ソフトウェアのインストールの一環としてメインフレームに作成されます。 2 つの重要な STC は次のとおりです。

    • ソースから変更されたデータをキャプチャするキャプチャ エージェント。
    • データベース管理システム (DBMS) 固有の API を使用して、変更されたデータをターゲットに効率的に書き込むアプライ エージェント。

    Note

    Db2 z/OS の場合、RDRS は、STC を必要としない Db2 ユーザー定義型 (UDT) を使用して、エージェントレス CDC ソリューションも提供します。

  4. オープン プラットフォーム マネージャー (OPM) はレプリケーション サーバーとして機能します。 このサーバーには、ソースとターゲットのメタデータを生成するための自動データ マッピング用のユーティリティが含まれています。 また、ソースからデータを抽出するためのルールセットも含まれています。 サーバーはターゲット システムのデータを変換して処理し、そのデータをターゲットに書き込みます。 このコンポーネントは、Linux、Unix、および Windows のオペレーティング システムにインストールできます。

  5. RDRS ダッシュボードでは、データ交換プロセスの管理、レビュー、操作、制御、および監視ができます。 RDRS コマンドライン ユーティリティは、データ交換プロセスを自動化して、データ同期プロセスの無人操作を管理します。

  6. RDRS アプライ エージェントは、DBMS 固有の API を使用します。 これらの API は、ソースの CDC テクノロジと組み合わせて、リアルタイムのデータ変更をターゲットの Azure データ サービス (つまり、データベースやファイル) に効率的に実装します。

  7. RDRS では、変更されたデータを Azure Event Hubs または Kafka に直接ストリーミングできます。 その後、仮想マシン (VM) 内の Azure Logic Apps、関数、またはカスタム ソリューションによって、これらのイベントは処理されます。

  8. RDRS でサポートされる Azure データ プラットフォーム ターゲットには、Azure SQL Database、Azure Database for PostgreSQL、Azure Database for MySQL、Azure Cosmos DB、Azure Data Lake Storage などがあります。

  9. Azure データ プラットフォームに格納されるデータは、Azure サービス、またはデータの表示が許可されている他のプラットフォームで使用されます。 Power BI、Azure Synapse Analytics、カスタム アプリケーションなどはその一例です。

  10. RDRS は、Azure データベース プラットフォーム (SQL Database、Azure Database for MySQL、Azure Database for PostgreSQL、または Data Lake Storage など) からの変更を逆同期してキャプチャし、メインフレーム データ層に書き戻すことができます。

  11. メインフレーム データベースのバックアップ ファイルとアンロード ファイルは、一括読み込みプロセスのために RDRS を使用して Azure VM にコピーされます。

  12. RDRS の一括読み込みでは、メインフレーム ソース データを使用して初期ターゲット データベースの読み込みが実行されます。 ソース データは、メインフレーム データ ストアまたはメインフレーム バックアップ ファイルまたはアンロード ファイルから直接読み取ることができます。 一括読み込みでは、拡張 2 進化 10 進交換コード (EBCDIC) パック フィールドなど、メインフレーム データ型の自動変換が行われます。 メインフレーム データベースを直接読み取るのではなく、バックアップ データまたはアンロード データを使用してパフォーマンスを最大限に高めます。 アンロード データまたはバックアップ データを必要な RDRS Azure VM に移動し、ネイティブ データベース ローダーを使用するとネットワーク入出力 (I/O) が最小限に抑えられ、読み込み時間が短縮されるため、データベースを直接読み取るべきではありません。

コンポーネント

このソリューションでは、次のコンポーネントが使用されます。

ネットワークと ID コンポーネント

  • Azure ExpressRoute: ExpressRoute を利用すると、接続プロバイダーによって処理されるプライベート接続を介して、オンプレミスのネットワークを Microsoft Cloud に拡張できます。 ExpressRoute を使用すると、Microsoft Azure や Microsoft 365 のようなクラウド サービスへの接続を確立できます。
  • Azure VPN Gateway: VPN Gateway は、パブリック インターネットを介して Azure 仮想ネットワークとオンプレミスの場所の間で暗号化されたトラフィックを送信する特定の種類の仮想ネットワーク ゲートウェイです。
  • Microsoft Entra ID: Microsoft Entra ID は、オンプレミスのディレクトリと同期できる ID およびアクセス管理サービスです。

アプリケーション コンポーネント

  • Logic Apps: Logic Apps を使用すると、自動化された定期タスクと定期プロセスを作成し、スケジュールに従って実行することができます。 Azure の内部および外部のサービス (HTTP または HTTPS エンドポイントなど) を呼び出したり、Azure Storage や Azure Service Bus のような Azure サービスにメッセージを投稿したり、ファイル共有にファイルをアップロードしたりできます。
  • Azure Functions: Azure Functions では、アプリケーション インフラストラクチャについて気にすることなく、関数と呼ばれる小さなコードを実行できます。 Azure Functions を使用すると、アプリケーションを大規模に実行し続けるために必要な最新のサーバーを、クラウド インフラストラクチャで利用できます。
  • Azure 仮想マシン: Azure VM はオンデマンドのスケーラブルなコンピューティング リソースです。 Azure VM では仮想化の柔軟性を利用でき、物理ハードウェアのメンテナンスは必要ありません。 Azure VM は、Windows システムと Linux システムの両方で動作します。

ストレージ コンポーネント

  • ストレージ: ストレージには、Azure Blob Storage、Azure Table Storage、Azure Queue Storage、Azure Files などのアンマネージド ストレージ ソリューションが用意されています。 Azure Files は再設計されたメインフレーム ソリューションに特に役立ち、マネージド SQL ストレージを備えた効果的なアドオンが用意されています。
  • Azure SQL: Azure SQL は、Azure の SQL Server 用のフル マネージドのサービスとしてのプラットフォーム (PaaS) です。 リレーショナル データは、他の Azure コンポーネント (Azure SQL Managed Instance、Azure SQL VM、Azure Database for PostgreSQL、Azure Database for MariaDB、MySQL など) に移行して効率的に使用することができます。
  • Azure Cosmos DB: Azure Cosmos DB は、メインフレームから表形式でないデータを移行する際に使用できる NoSQL オファリングです。

監視コンポーネント

  • Azure Monitor: Azure Monitor では、クラウドおよびオンプレミス環境のテレメトリを収集、分析し、対応する包括的なソリューションを提供します。
  • Application Insights: Application Insights は、アプリケーション テレメトリを分析して表示します。
  • Azure Monitor ログ: Azure Monitor ログは、監視対象のリソースからログ データとパフォーマンス データを収集して整理する Monitor の機能です。 Azure サービスからのプラットフォーム ログ、VM エージェントからのログ データとパフォーマンス データ、アプリケーションからの使用状況データとパフォーマンス データなど、複数のソースのデータを 1 つのワークスペースに統合し、何百万ものレコードを迅速に分析できる高度なクエリ言語を使用してまとめて分析することができます。
  • Log Analytics: Log Analytics は Azure portal 内のツールです。 ログ クエリを使用して、Azure Monitor ログで収集されたデータから分析情報を取得できます。 Log Analytics では強力なクエリ言語が使用されているため、複数のテーブルのデータを結合したり、大量のデータ セットを集約したり、最小限のコードで複雑な操作を実行したりできます。

考慮事項

以降の考慮事項には、ワークロードの品質向上に使用できる一連の基本原則である Azure "Well-Architected Framework" の要素が組み込まれています。 詳細については、「Microsoft Azure Well-Architected Framework」を参照してください。

コスト最適化

コストの最適化とは、不要な費用を削減し、運用効率を向上させる方法を検討することです。 詳しくは、コスト最適化の柱の概要に関する記事をご覧ください。 このソリューションの実装コストを見積もるには、Azure 料金計算ツールを使用します。

[信頼性]

信頼性により、顧客に確約したことをアプリケーションで確実に満たせるようにします。 詳細については、「信頼性の設計レビュー チェックリスト」を参照してください。

  • 高可用性を提供するために別の可用性ゾーンにデプロイされている Azure VM に RDRS OPM を設定します。 障害が発生すると、セカンダリ RDRS OPM がアクティブになり、セカンダリ RDRS OPM がその IP アドレスを RDRS メインフレーム マネージャに伝達します。 それを受けてメインフレームは、作業論理ユニット (LUW) と再始動ファイルの組み合わせを使用して、次の論理再始動ポイントで処理を続行する新しい RDRS OPM との通信を開始します。
  • ゾーン冗長をサポートするように Azure データベース サービスを設計して、障害が発生した場合や計画メンテナンス中に、そうしたサービスをセカンダリ ノードにフェールオーバーできるようにします。
  • Azure Monitor ログと Application Insights を使用して、Azure リソースの正常性を監視します。 予防的な管理のためのアラートを設定できます。

スケーラビリティ

  • 複数の並列レプリケーション ストリームを実行して、CDC 処理用に RDRS スケーリングを設定します。 まずは論理トランザクションに含まれるファイルを分析します。 これらのファイルは、順番にまとめて処理する必要があります。 RDRS CDC プロセスにより、各論理トランザクションの整合性が確保されます。 たとえば、一般的なトランザクションに関与しないテーブルのセットは、複数の処理スクリプトを作成することによって並列タスクに分割される場合があります。
  • RDRS は、1 つの Azure VM または複数の Azure VM で並列一括読み込み処理を同時に実行して、水平方向のスケーラビリティを実現します。 任意の間隔または行のフィルタリングを使用して、プロセスを複数のタスクに分割し、大きなテーブルに対して高速の一括読み込み操作を実行します。 行のフィルタリングでは、キー、パーティション キー、日付などのフィルターを使用できます。
  • SQL Database サーバーレス コンピューティング層には、ワークロードに基づく自動スケーリング オプションが用意されています。 ワークロードの需要を満たすために、自動化を使用して他の Azure データベースをスケールアップおよびスケールダウンできます。
  • 詳細については、Azure での自動スケールのベスト プラクティスに関するページを参照してください。

セキュリティ

セキュリティは、重要なデータやシステムの意図的な攻撃や悪用に対する保証を提供します。 詳細については、「セキュリティの設計レビュー チェックリスト」を参照してください。

  • Microsoft Entra ID を使用して RDRS の認証とアクセスを制御します。
  • トランスポート層セキュリティ (TLS) を使用して RDRS 製品間 (メインフレームから Azure へ) のデータ転送を暗号化します。
  • オンプレミス環境からの Azure へのプライベートで効率的な接続には、ExpressRoute またはサイト間 VPN を使用します。
  • Microsoft Entra ID を使用して Azure リソースを認証し、ロールベースのアクセス制御 (RBAC) を使用してアクセス許可を管理します。
  • Azure のデータベース サービスを使用して、保存データの暗号化 (TDE)、転送中のデータの暗号化 (TLS)、処理中のデータの暗号化など、さまざまなセキュリティ オプションをサポートします。そのため、データは常に暗号化されます。
  • セキュリティで保護されたソリューションの設計方法に関するガイドラインについては、「Azure セキュリティ ドキュメント」を参照してください。
  • セキュリティ ベースラインを確認するには、「Azure のセキュリティ ベースライン」を参照してください。

シナリオの詳細

メインフレームは、多数のトランザクションを処理するサーバーです。 メインフレーム アプリケーションは、毎日大量のデータを生成して使用しています。 パブリック クラウドは、弾力性、コストの最適化、使いやすさ、簡単な統合を備えています。 x86 アプリケーションとメインフレーム アプリケーションの多くがクラウドに移行しているため、組織はメインフレームからクラウドへのデータ統合と移行戦略を適切に設計する必要があります。

このシナリオでは、Rocket Software が提供する RDRS を使用して、IBM Z (メインフレーム) データ層と Azure クラウド データ プラットフォームを統合します。

考えられるユース ケース

このソリューションは、Azure データ プラットフォームへの大規模なデータ移行に最適です。 次のユース ケースについて、このシナリオを検討してください。

  • メインフレーム データ層の完全な移行: このユース ケースでは、顧客はすべての Db2、IMS、IDMS、ファイル、その他データをメインフレームから Azure データ プラットフォームに移動したいと考えています。
  • メインフレームと Azure ベースのアプリケーションの共存: このユース ケースでは、多くの場合、顧客はメインフレームと Azure データ プラットフォーム間の双方向同期をサポートする必要があります。
  • アーカイブ: このユース ケースでは、顧客は監査とコンプライアンスの目的でデータを格納したいと考えていますが、このデータに頻繁にアクセスすることを望んでいません。 Storage では、アーカイブ データを格納するための低コストのソリューショを利用できます。

共同作成者

この記事は、Microsoft によって保守されています。 当初の寄稿者は以下のとおりです。

プリンシパルの作成者:

その他の共同作成者:

  • Liz Casey | シニア コンテンツ開発者

パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。

次のステップ