Azure HDInsight 仮想ネットワーク アーキテクチャ

この記事では、HDInsight クラスターをカスタム Azure Virtual Network にデプロイするときに存在するリソースについて説明します。 この情報は、オンプレミスのリソースを Azure の HDInsight クラスターに接続するのに役立ちます。 Azure Virtual Network の詳細については、「Azure Virtual Network とは」をご覧ください。

Azure HDInsight クラスターでのリソースの種類

Azure HDInsight クラスターには、さまざまな種類の仮想マシン、つまりノードがあります。 それぞれのノードの種類が、システムの運用において役割を果たしています。 次の表は、これらのノードの種類とクラスターでのそれぞれの役割をまとめたものです。

Type 説明
ZooKeeper ノード Zookeeper は、データ処理を実行しているノード間でタスクを調整します。 また、ヘッド ノードのリーダー選定を行って、どのノードが特定のマスター サービスを実行しているかを追跡します。 ZooKeeper ノードの数は、3 台に固定されています。
ワーカー ノード データ処理機能をサポートするノードを表します。 ワーカー ノードをクラスターに追加したりクラスターから削除したりすることで、コンピューティング機能をスケーリングしてコストを管理することができます。
リージョン ノード HBase のクラスターの種類では、リージョン ノード (データ ノードとも呼ばれる) はリージョン サーバーを実行します。 リージョン サーバーは、HBase によって管理されるデータの一部を提供および管理します。 リージョン ノードをクラスターに追加したりクラスターから削除したりすることで、コンピューティング機能をスケーリングしてコストを管理できます。

リソースの名前付け規則

クラスター内のノードをアドレスを指定するときは、完全修飾ドメイン名 (FQDN) を使用します。 Ambari API を使用すると、クラスター内のさまざまなノードの種類の FQDN を取得できます。

これらの FQDN の形式は、<node-type-prefix><instance-number>-<abbreviated-clustername>.<unique-identifier>.cx.internal.cloudapp.net のようになります。

<node-type-prefix> は、ヘッドノードの場合は hn、ワーカー ノードの場合は wn、zookeeper ノードの場合は zn になります。

ホスト名のみが必要な場合は、FQDN の最初の部分 (<node-type-prefix><instance-number>-<abbreviated-clustername>) のみを使用します。

基本的な仮想ネットワーク リソース

次の図は、Azure での HDInsight ノードとネットワーク リソースの配置を示しています。

Diagram of HDInsight entities created in Azure custom VNET.

Azure Virtual Network の既定のリソースには、前の表で説明したクラスター ノードの種類が含まれています。 また、仮想ネットワークと外部のネットワークの間の通信をサポートするネットワーク デバイスが含まれます。

次の表は、HDInsight をカスタムの Azure Virtual Network にデプロイするときに作成される 9 台のクラスター ノードをまとめたものです。

リソースの種類 存在する数 詳細
ヘッド ノード two
Zookeeper ノード three
ワーカー ノード two この数は、クラスターの構成とスケーリングによって異なる場合があります。 Apache Kafka には、最小で 3 台のワーカー ノードが必要です。
ゲートウェイ ノード two ゲートウェイ ノードは、Azure に作成される Azure Virtual Machine ですが、サブスクリプションには表示されません。 これらのノードを再起動する必要がある場合は、サポートにお問い合わせください。

次に提示するネットワーク リソースは、HDInsight で使用される仮想ネットワーク内に自動的に作成されます。

ネットワーク リソース 存在する数 詳細
Load Balancer three
ネットワーク インターフェイス 9 この値は、各ノードが独自のネットワーク インターフェイスを持つ、通常のクラスターに基づきます。 この 9 個のインターフェイスは、2 台のヘッド ノード、3 台の Zookeeper ノード、2 台のワーカー ノード、および前の表で述べられた 2 台のゲートウェイ ノード用です。
パブリック IP アドレス two

HDInsight に接続するためのエンドポイント

HDInsight クラスターには次の 3 つの方法でアクセスできます。

  • 仮想ネットワークの外の HTTP エンドポイント CLUSTERNAME.azurehdinsight.net
  • ヘッド ノードに直接接続するための SSH エンドポイント CLUSTERNAME-ssh.azurehdinsight.net
  • 仮想ネットワーク内の HTTP エンドポイント CLUSTERNAME-int.azurehdinsight.net。 この URL に含まれている "-int" に注目してください。 このエンドポイントは、その仮想ネットワーク内のプライベート IP に解決され、パブリック インターネットからはアクセスできません。

これら 3 つのエンドポイントにはそれぞれロード バランサーが割り当てられています。

仮想ネットワーク外部からの接続を許可する 2 つのエンドポイントにはパブリック IP アドレスも提供されています。

  1. 1 つのパブリック IP は、インターネットからクラスターに接続するときに使用する完全修飾ドメイン名 (FQDN) のために、ロード バランサーに割り当てられています CLUSTERNAME.azurehdinsight.net
  2. 2 つ目のパブリック IP アドレスは、SSH 専用のドメイン名に使用されます CLUSTERNAME-ssh.azurehdinsight.net

次のステップ