統合ランタイムの管理
Data Factory で、アクティビティは、実行されるアクションを定義します。 リンクされたサービスは、ターゲットのデータ ストアやコンピューティング サービスを定義します。 統合ランタイムには、アクティビティおよびリンク サービスのインフラストラクチャが用意されています。
Integration Runtime は、リンク サービスまたはアクティビティによって参照され、アクティビティを実行したり、ディスパッチするコンピューティング環境が用意されています。 これにより、できるだけターゲットのデータ ストアやコンピューティング サービスに近いリージョンでアクティビティを実行して効率を最大化できる一方、セキュリティとコンプライアンスの必要も満たせます。
つまり、Integration Runtime (IR) は、Azure Data Factory に使用されるコンピューティング インフラストラクチャです。 次のようなさまざまなネットワーク環境向けにデータ統合機能が提供されています。
- Data Flow: マネージド Azure コンピューティング環境でデータ フローを実行します。
- データ移動:パブリック ネットワーク内のデータ ストアとプライベート ネットワーク (オンプレミスまたは仮想プライベート ネットワーク) 内のデータ ストアをまたいでデータをコピーします。 組み込みコネクタ、形式の変換、列のマッピング、パフォーマンスとスケーラビリティに優れたデータ転送に関するサポートを提供します。
- アクティビティのディスパッチ: Azure Databricks、Azure HDInsight、Azure Machine Learning、Azure SQL Database、SQL Server などのさまざまなコンピューティング サービスで実行される変換アクティビティをディスパッチして監視します。
- SSIS パッケージの実行:マネージド Azure コンピューティング環境で SQL Server Integration Services (SSIS) パッケージをネイティブに実行します。
Azure Data Factory インスタンスが作成されるたびに、パブリック ネットワークのクラウド データ ストアとコンピューティング サービスに対する操作をサポートする既定の Integration Runtime 環境が作成されます。 これは、統合ランタイムが "自動解決" に設定されている場合に表示されます
統合ランタイムの種類
Data Factory には 3 種類の統合ランタイムが用意されているので、ご希望のデータ統合機能やネットワーク環境のニーズに最もかなっている種類を選択する必要があります。 次の 3 種類があります。
- Azure
- セルフホステッド
- Azure-SSIS
connectVia プロパティで Integration Runtime 設定を明示的に定義できます。これが定義されていない場合は、既定の統合ランタイムが使用され、プロパティは "自動解決" に設定されます。
次の表で、各種の統合ランタイムの機能とネットワークのサポートについて説明します。
IR の種類 | パブリック ネットワーク | プライベート ネットワーク |
---|---|---|
Azure | Data Flow | Data Flow |
データの移動 | データの移動 | |
アクティビティのディスパッチ | アクティビティのディスパッチ | |
セルフホステッド | データの移動 | データの移動 |
アクティビティのディスパッチ | アクティビティのディスパッチ | |
Azure-SSIS | SSIS パッケージ実行 | SSIS パッケージ実行 |
使用する統合ランタイムの決定
使用する統合ランタイムに影響するさまざまな要因があります。 適切な IR を選択するために役立つガイドを次に示します。
コピー アクティビティ
Copy アクティビティの場合、データ フローの方向を定義するのに、ソースとシンクのリンクされたサービスが必要です。 どの統合ランタイム インスタンスを使用してコピーを実行するかを決めるために、次のロジックが使用されます。
2 つのクラウド データ ソース間でのコピー: ソースとシンクの両方のリンクされたサービスで Azure IR を使用している場合、ADF は、場所が指定されている場合は、そのリージョンの Azure IR を使用します。自動解決 IR (既定) が選択されている場合は、「統合ランタイムの場所」セクションで説明したとおり、Azure IR の場所を自動的に決定します。
クラウド データ ソースとプライベート ネットワーク内のデータ ソースの間でのコピー: ソースかシンクのいずれかのリンクされたサービスがセルフホステッド IR を指している場合、そのセルフホステッド統合ランタイム上でコピー アクティビティが実行されます。
プライベート ネットワーク内の 2 つのデータソース間でのコピー: ソースとシンクの両方がリンクされたサービスは、統合ランタイムの同じインスタンスを指している必要があり、その統合ランタイムを使用してコピー アクティビティが実行されます。
Lookup および GetMetadata アクティビティ
Lookup および GetMetadata アクティビティは、データ ストアのリンクされたサービスに関連付けられている統合ランタイム上で実行されます。
変換アクティビティ
各変換アクティビティには、ターゲット コンピューティングのリンクされたサービスがあり、これは統合ランタイムに向けられています。 この統合ランタイム インスタンスから、変換アクティビティがディスパッチされます。
Data Flow アクティビティ
Data Flow アクティビティは、それに関連付けられている統合ランタイムで実行されます。