オンプレミス データ ゲートウェイのサイズ設定

この記事は、オンプレミス データ ゲートウェイをインストールおよび管理する必要がある Power BI 管理者を対象としています。

インターネット経由で直接アクセスできないデータに Power BI がアクセスする必要がある場合は常に、ゲートウェイが必要です。 オンプレミスのサーバー、または VM でホストされるサービスとしてのインフラストラクチャ (IaaS) にインストールできます。

ゲートウェイのワークロード

オンプレミス データ ゲートウェイは、2 つのワークロードをサポートします。 ゲートウェイのサイズ設定と推奨事項について説明する前に、まずこれらのワークロードについて理解しておくことが重要です。

キャッシュ データ ワークロード

"キャッシュ データ" ワークロードでは、Power BI セマンティック モデル (旧称はデータ セット) に読み込むソース データが取得および変換されます。 これは、次の 3 つの手順で行います。

  1. 接続: ゲートウェイがソース データに接続します。
  2. データの取得と変換:データが取得され、必要に応じて変換されます。 可能な場合は常に、Power Query マッシュアップ エンジンからデータ ソースに変換ステップがプッシュされます。これは " クエリ フォールディング " と呼ばれます。 可能でない場合は、ゲートウェイで変換を処理する必要があります。 この場合、ゲートウェイの CPU とメモリ リソースの消費量が多くなります。
  3. 転送: データが Power BI サービスに転送されます。特に大規模なデータ ボリュームでは、信頼性が高く、高速なインターネット接続が重要です。

オンプレミスのソースに接続するオンプレミスのデータ ゲートウェイが表示されているキャッシュ データの図。

ライブ接続および DirectQuery ワークロード

"ライブ接続および DirectQuery" ワークロードは、主にパススルー モードで動作します。 Power BI サービスからクエリが送信され、ゲートウェイからクエリの結果が返されます。 一般に、クエリ結果のサイズは軽量です。

このワークロードには、クエリとクエリ結果をルーティングするために CPU リソースが必要です。 通常、キャッシュ データ ワークロードに必要な CPU よりも、CPU の必要量ははるかに少なくなります。キャッシュのためにデータを変換する必要がある場合は特にそうです。

応答性の高いエクスペリエンスをレポート ユーザーに提供するには、信頼性が高く、高速で、一貫性のある接続が重要です。

オンプレミスのソースに接続するオンプレミスのデータ ゲートウェイが表示されているライブ接続と DirectQuery の図。

サイズ設定に関する考慮事項

ゲートウェイ マシンの適切なサイズ設定の判断は、次の可変要素によって変わる可能性があります。

  • キャッシュ データのワークロードの場合:
    • 同時実行セマンティック モデルの更新数
    • データ ソースの種類 (リレーショナル データベース、分析データベース、データ フィード、またはファイル)
    • データ ソースから取得されるデータの量
    • Power Query マッシュアップ エンジンによって処理する必要がある変換
    • Power BI サービスに転送されるデータの量
  • ライブ接続および DirectQuery ワークロードの場合:
    • 同時実行レポート ユーザーの数
    • レポート ページ上のビジュアルの数 (各ビジュアルから少なくとも 1 つのクエリが送信されます)
    • Power BI ダッシュボードのクエリ キャッシュの更新頻度
    • [ページの自動更新] 機能を使用するリアルタイム レポートの数
    • セマンティック モデルで行レベルのセキュリティ (RLS) が適用されるかどうか

一般に、ライブ接続および DirectQuery ワークロードには十分な CPU が必要ですが、キャッシュ データ ワークロードにはさらに多くの CPU とメモリが必要です。 どちらのワークロードも、Power BI サービスとの良好な接続とデータ ソースに左右されます。

注意

Power BI の容量によって、モデル更新並列処理と、ライブ接続および DirectQuery のスループットに制限が課せられます。 ゲートウェイのサイズを Power BI サービスがサポートする値よりも高く設定しても意味がありません。 Premium SKU (および同等のサイズの SKU) の場合の制限は異なります。 詳細については、「Microsoft Fabric 容量ライセンス」と「Power BI Premium とは」を参照してください(容量ノード)」を参照してください。

重要

この記事では、Power BI Premium またはその容量サブスクリプション (P SKU) に言及することがあります。 現在、Microsoft は購入オプションを統合し、容量あたりの Power BI Premium SKU を廃止していることに注意してください。 新規および既存のお客様は、代わりに Fabric 容量サブスクリプション (F SKU) の購入をご検討ください。

詳細については、「Power BI Premium ライセンスに関する重要な更新」と「Power BI Premium のよく寄せられる質問」を参照してください。

推奨事項

ゲートウェイのサイズ設定の推奨事項は、多くの可変要素によって変わります。 このセクションでは、考慮する必要がある一般的な推奨事項について説明します。

初期サイズ設定

適切なサイズを正確に見積もることが困難な場合があります。 少なくとも 8 個の CPU コア、8 GB の RAM、複数のギガビット ネットワーク アダプターを搭載したコンピューターから始めることをお勧めします。 次に、CPU とメモリのシステム カウンターをログに記録して、通常のゲートウェイのワークロードを測定することができます。 詳細については、「オンプレミスデータゲートウェイのパフォーマンスの監視と最適化」を参照してください。

接続

Power BI サービスとゲートウェイ間と、ゲートウェイとデータ ソース間に可能な限り最適な接続を計画します。

  • 信頼性、高速、短く一貫した待機時間を目指します。
  • ゲートウェイとデータ ソース間のマシンのホップをなくすか減らします。
  • ファイアウォール プロキシ レイヤーによって課される帯域幅調整をなくします。 Power BI エンドポイントの詳細については、「Power BI URL を許可リストに追加する」をご覧ください。
  • Azure ExpressRoute を設定して、Power BI に対して非公開の管理された接続を確立します。
  • Azure VM のデータ ソースの場合、必ず VM を Power BI サービスと同じ場所に配置します
  • 動的 RLS を含む SQL Server Analysis Services (SSAS) へのライブ接続ワークロードの場合、ゲートウェイ マシンとオンプレミスの Active Directory 間に良好な接続を確保します。

クラスタリング

大規模な展開の場合は、複数のクラスター メンバーを持つゲートウェイを作成できます。 複数のクラスターによって単一障害点を回避し、ゲートウェイ全体でトラフィックを負荷分散することができます。 以下のことを行えます。

  • クラスターに 1 つ以上のゲートウェイをインストールします。
  • スタンドアロン ゲートウェイ、またはゲートウェイ サーバーのクラスターにワークロードを分離します。

詳細については、「オンプレミス データ ゲートウェイの高可用性クラスターと負荷分散の管理」を参照してください。

セマンティック モデルの設計と設定

セマンティック モデルの設計とその設定は、ゲートウェイのワークロードに影響する可能性があります。 ゲートウェイのワークロードを減らすには、次の操作を検討します。

セマンティック モデルのインポートの場合:

  • データの更新頻度を低く設定します。
  • 転送するデータの量を最小限に抑えるように増分更新を設定します。
  • 可能な場合は常にクエリ フォールディングを実行します。
  • 特に、大量のデータの場合や待機時間を短くする必要がある場合は、設計を DirectQuery または複合モデルに変換します。

DirectQuery セマンティック モデルの場合:

  • データソース、モデル、レポートのデザインを最適化します。詳細については、「Power BI Desktop の DirectQuery モデルのガイダンス」を参照してください。
  • 集計を作成して高レベルの結果をキャッシュし、DirectQuery 要求の数を減らします。
  • レポートのデザインと容量設定で、ページの自動更新間隔を制限します。
  • 特に動的 RLS が適用される場合、ダッシュボードのキャッシュの更新頻度を制限します。
  • 特にデータ ボリュームが少ない場合、または非揮発性データの場合は、設計をインポートまたは複合モデルに変換します。

ライブ接続セマンティック モデルの場合:

  • 特に動的 RLS が適用される場合、ダッシュボードのキャッシュの更新頻度を制限します。

この記事に関する詳細については、次のリソースを参照してください。