Azure 上の IBM DB2 pureScale

[アーティクル]
10/15/2024

IBM DB2 pureScale 環境は、Linux オペレーティングシステム上で高可用性とスケーラビリティを備えた Azure 向けデータベースクラスターを提供します。この記事では、Azure 上で DB2 pureScale を実行するためのアーキテクチャを紹介します。

概要

企業では長い間、オンライントランザクション処理 (OLTP) のニーズに応えるために、従来のリレーショナルデータベース管理システム (RDBMS) プラットフォームを使用してきました。今日、容量を拡大し、コストを削減し、一定した運用コスト構造を維持するために、多くの企業がメインフレームベースのデータベース環境を Azure に移行しています。多くの場合、移行はレガシープラットフォームを最新化する最初のステップとなります。

最近、ある企業のお客様は、z/OS 上で動作している IBM DB2 環境を Azure 上の IBM DB2 pureScale に再ホストしました。 DB2 pureScale データベースクラスターソリューションは、Linux オペレーティングシステムで高可用性とスケーラビリティを提供します。お客様は、DB2 pureScale をインストールする前に、Azure の大規模なスケールアップシステムの単一の仮想マシン (VM) で、スタンドアロンのスケールアップインスタンスとして DB2 を正常に実行しました。

元の環境と同一ではありませんが、Linux 上の IBM DB2 pureScale は、メインフレーム上の Parallel Sysplex 構成で実行される z/OS 向けの IBM DB2 とほぼ同等の高可用性とスケーラビリティの機能を提供します。このシナリオでは、クラスターは iSCSI 経由で共有ストレージクラスターに接続されます。特にクラウドストレージに対して最適化された無料のスケーラブルなオープンソース分散ファイルシステムとして、GlusterFS ファイルシステムを使用しました。ただし、IBM ではこのソリューションはサポートされなくなりました。 IBM からのサポートを維持するには、サポートされている iSCSI 互換ファイルシステムを使用する必要があります。 Microsoft では、記憶域スペースダイレクト (S2D) をオプションとして提供しています。

この記事では、この Azure への移行に使用されるアーキテクチャについて説明します。顧客は、構成をテストするために Red Hat Linux 7.4 を使用していました。このバージョンは、Azure Marketplace から入手できます。 Linux ディストリビューションを選択する前に、現在サポートされているバージョンを必ず確認してください。詳細については、IBM DB2 pureScale と GlusterFS に関するドキュメントを参照してください。

この記事は、DB2 実装計画の出発点です。業務要件は違っても、同じ基本パターンが適用されます。また、このアーキテクチャパターンは、Azure 上のオンライン分析処理 (OLAP) アプリケーションにも使用できます。

この記事では、z/OS 対応の IBM DB2 データベースから Linux 上で実行される IBM DB2 pureScale へ移行する際の相違点や想定される移行タスクについては説明しません。また、DB2 z/OS から DB2 pureScale へ移行する際のサイズ設定の見積もりやワークロード分析についても説明しません。

お使いの環境に最適な DB2 pureScale アーキテクチャを決定できるように、十分にサイズ設定を見積もり、仮説を立てることをお勧めします。ソースシステム上で、データ共有アーキテクチャ、Coupling Facility 構成、分散データ機能 (DDF) 利用状況統計が備わった DB2 z/OS Parallel Sysplex について必ず検討してください。

Note

この記事では、DB2 移行の 1 つの方法を取り上げていますが、方法はほかにもあります。たとえば、DB2 pureScale は仮想化されたオンプレミス環境で実行することもできます。 IBM ではさまざまな構成で、Microsoft Hyper-V 上の DB2 をサポートしています。詳細については、IBM Knowledge Center のDB2 pureScale 仮想化アーキテクチャに関するページを参照してください。

Architecture

Azure 上での高可用性とスケーラビリティをサポートするために、スケールアウトの共有データアーキテクチャを DB2 pureScale に使用できます。顧客の移行では、次のアーキテクチャの例を使用しました。

ストレージとネットワークを示す、Azure 仮想マシン上の DB2 pureScale

この図は、DB2 pureScale クラスターに必要な論理層を示しています。これらには、クライアント用、管理、キャッシング用、データベースエンジン用、および共有ストレージ用の仮想マシンが含まれます。

この図には、データベースエンジンノードに加えて、クラスターキャッシング機能 (CF) に使用される 2 つのノードも含まれています。データベースエンジン自体には、最低 2 つのノードが使用されます。 pureScale クラスターに属している DB2 サーバーはメンバーと呼ばれています。

クラスターは、スケールアウトストレージと高可用性を提供するために、iSCSI 経由で 3 ノード共有ストレージクラスターに接続されています。 DB2 pureScale は、Linux を実行している Azure 仮想マシンにインストールされます。

この方法は、組織の規模とスケールに応じて変更できるテンプレートです。これは以下の項目に基づいています。

2 つ以上のデータベースメンバーが 2 つ以上の CF ノードと組み合わされます。このノードは、共有メモリのグローバルバッファープール (GBP) とグローバルロックマネージャー (GLM) サービスを管理して、アクティブなメンバーからの共有アクセスとロックの競合を制御します。 1 つの CF ノードはプライマリとして、もう 1 つはセカンダリのフェールオーバー CF ノードとして機能します。その環境内で単一障害点を回避するために、DB2 pureScale クラスターには 4 つ以上のノードが必要です。
高パフォーマンスの共有ストレージ (図の P30 サイズに表示)。各ノードはこのストレージを使用します。
データメンバーと共有ストレージの高パフォーマンスネットワーク。

コンピューティングに関する考慮事項

このアーキテクチャは、Azure 仮想マシン上でアプリケーション、ストレージ、およびデータ層を実行します。展開セットアップスクリプトでは、以下を作成します。

DB2 pureScale クラスター。 Azure 上で必要なコンピューティングリソースの種類は、設定に依存します。一般的には、次の 2 つの方法を使用できます。
- マルチノードの、ハイパフォーマンスコンピューティング (HPC) 形式のネットワークを使用する。この場合、小規模から中規模サイズのインスタンスから共有ストレージにアクセスします。この HPC タイプの構成では、Azure のメモリ最適化 E シリーズまたはストレージ最適化 L シリーズの仮想マシンによって、必要なコンピューティング性能が提供されます。
- データエンジンに使用する大規模な仮想マシンインスタンスの数を減らす。大規模なインスタンスの場合、大量のメモリ内ワークロードには最大のメモリ最適化 M シリーズの仮想マシンが理想的です。 DB2 の実行に使用される論理パーティション (LPAR) のサイズによっては、専用のインスタンスが必要になる場合があります。
DB2 CF では、E シリーズや L シリーズなど、メモリ最適化の仮想マシンを使用します。
Linux を実行している Standard_DS4_v2 仮想マシンを使用する共有ストレージクラスター。
管理ジャンプボックスは、Linux を実行している Standard_DS2_v22 仮想マシンです。別の方法として Azure Bastion もあります。これは、仮想ネットワーク内のすべての VM にセキュリティで保護された RDP/SSH エクスペリエンスを提供するサービスです。
クライアントは、Windows を実行している Standard_DS3_v2 仮想マシンです (テストに使用されます)。
オプション。ミラーリング監視サーバー。これは、以前の特定のバージョンの DB2 pureScale でのみ必要です。この例では、Linux を実行している Standard_DS3_v2 仮想マシンを使用します (DB2 pureScale に使用されます)。

Note

DB2 pureScale クラスターには、DB2 インスタンスが 2 つ以上必要です。また、キャッシュインスタンスとロックマネージャーインスタンスも必要になります。

ストレージに関する考慮事項

Oracle RAC と同様に、DB2 pureScale は、高パフォーマンスブロック I/O のスケールアウトデータベースです。ニーズに適した最大の Azure Premium SSD オプションを使用することをお勧めします。開発環境とテスト環境には、より小規模なストレージオプションが適しているかもしれませんが、運用環境では多くの場合、ストレージ容量がさらに必要になります。例のアーキテクチャでは、サイズと価格に対する IOPS の比率から、P30 を使用しています。最適なパフォーマンスのためには、サイズに関係なく Premium Storage を使用します。

DB2 pureScale では、あらゆるものを共有するアーキテクチャを使用します。ここでは、全クラスターノードからすべてのデータにアクセスできます。オンデマンドまたは専用インスタンスのどちらであっても、複数のインスタンス間で Premium Storage を共有する必要があります。

大規模な DB2 pureScale クラスターでは、100,000 の IOPS と共に、200 テラバイト (TB) 以上のプレミアム共有ストレージが必要になる場合があります。 DB2 pureScale では、Azure 上で使用できる iSCSI ブロックインターフェイスがサポートされています。 iSCSI インターフェイスには、S2D または別のツールを使用して実装できる共有ストレージクラスターが必要になります。このタイプのソリューションでは、Azure 上に仮想ストレージエリアネットワーク (vSAN) デバイスを作成します。 DB2 pureScale では vSAN を使って、仮想マシン間でのデータ共有に使用されるクラスター化されたファイルシステムをインストールします。

ネットワークに関する考慮事項

IBM は、DB2 pureScale クラスター内のすべてのメンバーに対して InfiniBand ネットワークを推奨しています。 DB2 pureScale では、利用可能な場合は CF にリモートダイレクトメモリアクセス (RDMA) も使用されます。

セットアップ中に、Azure リソースグループを作成してすべての仮想マシンを含めます。一般には、リソースの有効期間や管理者に基づいて、リソースをグループ化します。このアーキテクチャ内の仮想マシンには、高速ネットワークが必要です。これは、1 つの仮想マシンに対してシングルルート I/O 仮想化 (SR-IOV) を介して、一貫性のある超低ネットワーク待ち時間を提供する Azure 機能です。

どの Azure 仮想マシンも、メイン、Gluster FS フロントエンド (gfsfe)、Gluster FS バックエンド (bfsbe)、DB2 pureScale (db2be)、DB2 pureScale フロントエンド (db2fe) というサブネットを含む仮想ネットワークにデプロイされます。また、インストールスクリプトは、メインサブネットの仮想マシン上にプライマリ NIC を作成します。

仮想ネットワーク内のネットワークトラフィックを制限したり、サブネットを分離したりするには、ネットワークセキュリティグループを使用します。

Azure では、DB2 pureScale は、ストレージのネットワーク接続として TCP/IP を使用する必要があります。

次のステップ

Azure 上にこのアーキテクチャを展開する

次の方法で共有