Azure でのクラウド規模の分析を使用した SAP インジェスト

Azure では、BusinessWare や SAP ERP Central Component (ECC) など、SAP データ ソースからデータを抽出して取り込むための多くのアプローチをサポートできます。 SAP システムは、モノリシック構造によって複数のドメインが切断されるので複雑です。 推奨されるパターンは、ビジネス グループごとに、そのデータを SAP からデータ ランディング ゾーンに取り込むことです。 データはエンリッチされたレイヤーに (生のまま) 提示され、Microsoft Entra グループのアクセス制御に従ってアクセスできます。 中央財務チームは、財務オブジェクトをキュレーションして 1 つのデータ資産に取り込み、データ ランディング ゾーンの要件に対応できます。

組織のデータ ボリュームと待機時間の要件に応じて、3 つのパターンの 1 つで取り込み要件をサポートできます。

Azure Data Factory

Data Factory では、SAP システムとさまざまなデータベース (SAP HANA を含む) への複数のコネクタが提供されます。 これらを使用して、コード不要の簡単なデータ変換を数分で作成できます。 差分レプリケーションは既定では使用できませんが、若干のプログラミングで実現できます。 Azure Data Factory は、少なくとも 15 分間隔でのバッチ処理またはマイクロバッチでのみサポートされます。

PULL オプションと説明されているこの Data Factory オプションでは、SAP へのシングル サインオンとセキュリティ保護されたネットワーク通信認証がサポートされます。 また、コード不要のデータ変換を使用して、柔軟なデータ準備とエンリッチメント コーディングのために Azure Databricks と統合できる、回復性があるデータ フローを構築するためのオプションも提供されます。 これはバッチ処理に限定され、差分抽出をサポートするためのロジックをコーディングする必要があります。 また、SAP Operational Data Provisioning (ODP) フレームワークを活用する新しい SAP ODP コネクタを評価することもできます。 この新しいコネクタは、ODP をサポートするすべての SAP システムに接続して、フル データ読み込みと増分データ読み込みを実行できます。

SAP Landscape Transformation Replication Server と Business Objects Data Services

SAP Landscape Transformation Replication Server (SLT) は、トリガーベースのレプリケーションを使用してデータを抽出する SAP NetWeaver のアドオンです。 このサービスは、ソースの Business Objects Data Services (DATA SERVICES) と統合して、抽出、読み込み、変換の機能を提供し、転送するデータセット ファイルを作成します。 このオプションは、バッチとほぼリアルタイムの両方のインジェストで考慮できます。

PUSH オプションとして説明されているこの SAP ベースのオプションを使用すると、すべての SAP データに対するシンプルで統一された構成により、トリガーベースのレプリケーションとほぼリアルタイムの抽出が容易になります。 これには、SAP ライセンス、追加のダウンストリーム ステップ、およびデータを Azure に移動するためのスケジュールが必要であり、これには AzCopy などのファイル コピー ツールに依存する複数のネットワーク ホップが含まれます。

サードパーティ製のツール

SAP ソースからのリアルタイムでの付加価値抽出と取り込みを提供できる、サードパーティ製ツールが多数存在します。 Microsoft は、Qlik Replicate (旧称 Attunity)、Simplement Data LiberatorKagool Velocity をお勧めします。 いずれでも同様の機能が提供され、SAP からほぼリアルタイムでデータを抽出して、ビジネス コンテキストとインテリジェンスを標準で提供できます。

これらのサービスは、技術的なアーキテクチャが異なります。 Qlik Replicate と Simplement Data Liberator では、ソース データベース ログの変更を識別することで、ほぼリアルタイムのレプリケーションが提供されます。 Kagool Velocity では、SAP NetWeaver へのアドオンを使用して、データを公開するためのアプリケーション レイヤーへのコメント要求が送信されます。 前述のオプションと比較すると、これらのオプションを使用すると、よりよい標準機能とほぼリアルタイムのサポートが提供されますが、サードパーティのテクノロジが必要です。

推奨

  • 主要な推奨事項は、SAP ODP コネクタを次のように使用することです。

    • SAP ECC Extractors、SAP S/4HANA CDS Views、SAP BW、SAP BW4/HANA、SAP SLT、SAP HANA Views に接続するための 1 つのコネクタが提供されます。

    • 既存の CDS ビューと、既に提供されているカスタムで作成されたビューを使用することで、SAP S/4HANA と SAP BW からデータを簡単に抽出できます。

    • テーブル レベルでトリガー ベースのデータ キャプチャを可能にする SLT を使用できます。

    • Azure Data Factory と Synapse Pipelines のデータ フローを使用すると、ウォーターマークを必要とせず、データ抽出が簡単になります。

    • データ フローにより、ODP メタデータに基づいて正しい順序でシンクに変更を適用するための組み込み機能が提供され、開発者が挿入/更新/削除/アップサートを処理するカスタム コードを作成するために必要な複雑さが完全に隠されます。

    • データ フローでは、抽出の失敗時に復旧を実行するためのカスタム ロジックを必要としない、ODQ フレームワークの回復メカニズムが透過的に使用されます。

    • データ フローでは、データ抽出のパフォーマンスを向上させるために、高スループット (並列読み取り、パーティション分割など) という利点が提供されます。

  • ハイブリッド アプローチの使用も選択可能なオプションであり、SAP データのインジェスト戦略として機能するいくつかのオプションで構成される場合があります。 SAP SLT、BODS、Qlik を使用して SAP トランザクション システム (SAP ECC など) からデータが抽出され、Azure Data Lake Storage への書き込みの前にデータを Parquet 形式に変換するため、Data Factory によりデータが Azure にプルされます。 SAP NetWeaver Business Warehouse からデータを独立して抽出することにより、既存のフレームワークを利用します。

次の手順

Azure でのクラウド規模の分析を、自動インジェスト フレームワークでサポートする方法