レイクハウス デプロイ パイプラインと Git 統合 (プレビュー)
レイクハウスは、Microsoft Fabric のライフサイクル管理機能と統合され、製品の寿命を通じてすべての開発チーム メンバー間の標準化されたコラボレーションを提供します。 ライフサイクル管理は、機能とバグ修正を複数の環境に継続的に提供することで、製品の効果的なバージョン管理とリリース プロセスを容易にします。 詳細については、「Microsoft Fabric のライフサイクル管理とは」を参照してください。
重要
この機能はプレビュー段階にあります。
レイクハウス Git 統合
レイクハウスは、ワークスペース内の複数のオブジェクトで参照されるメタデータとデータの両方が入ったアイテムです。 レイクハウスには、プライマリ管理可能なデータ コンテナー アイテムとしてテーブル、フォルダー、およびショートカットが入っています。 開発ワークフローの観点からは、次の依存オブジェクトがレイクハウスを参照している可能性があります。
- データフローとデータ パイプライン
- Spark ジョブ定義
- Notebooks
- セマンティック モデルと Power BI
既定のセマンティック モデルと SQL 分析エンドポイントメタデータは、レイクハウスに関連しており、既定では Git 更新プロセスによって管理されます。 原則として、Git ではデータは追跡されず、メタデータのみが追跡されます。
Git 表現
次のレイクハウス情報は、Git に接続されたワークスペースでシリアル化および追跡されます。
- [表示名]
- 説明
- 論理 guid
Note
追跡される論理 guid は、アイテムとそのソース管理表現を表す、自動的に生成されたクロスワークスペース識別子です。
重要
現在のエクスペリエンスでは、git で追跡されるのはレイクハウス コンテナー成果物のみです。 テーブル、フォルダー、ショートカット、その他のメタデータの変更は、git では追跡されず、バージョン管理もされません。
レイクハウス Git 統合機能
次の機能を利用できます。
- レイクハウス オブジェクト メタデータの Git JSON 表現へのシリアル化。
- 変更を直接適用するか、pull request を使用して、アップストリームまたはダウンストリームのワークスペースとブランチへの変更を制御します。
- レイクハウスの名前変更は Git では追跡されます。 名前が変更されたレイクハウスを更新すると、既定のセマンティック データ モデルと SQL Analytics エンドポイントの名前も変更されます。
- これらのアイテムのテーブル、フォルダーとショートカット、メタデータ、およびデータに適用されるアクションは常に保持されません。
デプロイ パイプライン内のレイクハウス
レイクハウスは、Microsoft Fabric ライフサイクル管理デプロイ パイプラインでサポートされています。 この結果、環境のセグメント化ベスト プラクティスが可能になります。
レイクハウス デプロイ パイプライン統合機能:
開発、テスト、運用の各ワークスペース間でのデプロイ。
レイクハウスは、デプロイ時に依存オブジェクトとして削除できます。 デプロイ パイプライン コンテキスト内の異なるレイクハウスのマッピングもサポートされています。
デプロイ パイプラインの構成時に何も指定されない場合は、同じ名前の新しい空のレイクハウス オブジェクトがターゲット ワークスペースに作成されます。 ノートブックと Spark ジョブ定義が再マップされ、新しいワークスペース内の新しいレイクハウス オブジェクトが参照されます。
デプロイ パイプラインの構成時に、レイクハウス依存関係が別のレイクハウス (アップストリームのレイクハウスなど) を参照するように構成されている場合でも、同じ名前の新しい空のレイクハウス オブジェクトがターゲット ワークスペースに作成されますが、Notebooks と Spark ジョブ定義の参照は、要求に応じて別のレイクハウスに保存されます。
SQL Analytics エンドポイントとセマンティック モデルは、レイクハウス デプロイの一部としてプロビジョニングされます。
レイクハウス内のオブジェクトは上書きされません。
レイクハウス名の更新は、デプロイ パイプライン コンテキスト内のワークスペース間で同期できます。