Unity Catalog 管理テーブルの予測最適化

[アーティクル]
02/07/2025

Note

2024 年 11 月 11 日以降に作成されたすべてのアカウントについて、Databricks では既定で予測最適化が有効になります。

予測最適化により、Azure Databricks 上の Unity Catalog のマネージドテーブルのメンテナンス操作について、手動で管理する必要がなくなります。

予測最適化を有効にすると、Azure Databricks によって次の処理が自動的に実行されます。

メンテナンス操作の恩恵を受けるテーブルを識別し、これらの操作を実行するキューに入れます。
データがマネージドテーブルに書き込まれるときに統計を収集します。

メンテナンス操作は必要に応じて実行されるため、メンテナンス操作の不要な実行と、パフォーマンスの追跡とトラブルシューティングに伴う負担の両方が排除されます。

重要

予測最適化は、Unity カタログのマネージドテーブルでのみ実行されます。

予測最適化は、Databricks SQL または Delta Live Tables パイプラインを使用して作成されたストリーミングテーブルまたは具体化されたビューでは実行されません。

予測最適化ではどのような操作を行いますか?

予測最適化では、有効なテーブルに対して、次のような操作が自動的に実行されます。

操作	説明
`OPTIMIZE`(1)	有効なテーブルの増分クラスタリングをトリガーします。「Delta テーブルに Liquid Clustering クラスタリングを使用する」を参照してください。ファイルサイズを最適化することで、クエリのパフォーマンスを向上させます。「データファイルレイアウトを最適化する」を参照してください。
`VACUUM`	テーブルで参照されなくなったデータファイルを削除することで、ストレージコストを削減します。「VACUUM を使用して未使用のデータファイルを削除する」を参照してください。
`ANALYZE`	クエリのパフォーマンスを向上させるために、統計の増分更新をトリガーします。 [https://docs.microsoft.com/azure/active-directory/develop/scenario-protected-web-api-overview](ANALYZE TABLE) をご覧ください。

(1)予測最適化を使用して実行した場合、OPTIMIZE は ZORDER 実行されません。

警告

VACUUM コマンドの保持期間は delta.deletedFileRetentionDuration テーブルプロパティによって決定され、既定では 7 日間です。つまり、VACUUM は、過去 7 日間の Delta テーブルバージョンで参照されなくなったデータファイルを削除します。より長期間データを保持したい場合 (より長い期間のタイムトラベルをサポートするためなど)、次の例に示すように予測最適化を有効にする前に、このテーブルプロパティを適切に設定する必要があります。

ALTER TABLE table_name SET TBLPROPERTIES ('delta.deletedFileRetentionDuration' = '30 days');

予測最適化はどこで行われますか?

予測最適化では、 ANALYZE、 OPTIMIZE、および VACUUM 操作の恩恵を受けるテーブルを識別し、ジョブに対してサーバーレスコンピューティングを使用して実行するようにキューに格納します。お客様のアカウントは、Databricks 管理サービスに固有の SKU を使用して、これらのワークロードに関連するコンピューティングに対して請求されます。 Databricks 管理サービスの価格を参照してください。 Azure Databricks は、予測最適化の運用、コスト、影響に対する可観測性用にシステムテーブルを提供します。「予測最適化を追跡するためにシステムテーブルを使用する」を参照してください。

予測最適化の前提条件

予測最適化を有効にするには、次の要件を満たす必要があります。

Azure Databricks ワークスペースには、予測最適化をサポートするリージョンで Premium プランが必要です。「Azure Databricks のリージョン」を参照してください。
予測最適化を有効にする場合は、SQL ウェアハウスまたは Databricks Runtime 12.2 LTS 以降を使用する必要があります。
Unity Catalog マネージドテーブルのみがサポートされています。
ストレージアカウントにプライベート接続が必要な場合は、サーバーレスプライベート接続を構成する必要があります。「サーバーレスコンピューティングからのプライベート接続を構成する」を参照してください。

予測最適化を有効にする

アカウント、カタログ、またはスキーマの予測最適化を有効にすることができます。すべての Unity カタログマネージドテーブルは、既定でアカウント値を継承します。カタログまたはスキーマのアカウントの既定値をオーバーライドして、そのレベルで予測最適化を有効または無効にすることができます。

Note

2024 年 11 月 11 日以降にアカウントが作成された場合、既定では、アカウントの予測最適化が有効になります。

指定されたレベルで予測最適化を有効または無効にするには、次のような権限が必要です。

Unity Catalog オブジェクト	権限
取引先企業	アカウント管理者
カタログCatalog	カタログ所有者
[スキーマ]	スキーマの所有者

Note

予測最適化を初めて有効にすると、Azure Databricks は自動的に Azure Databricks アカウントにサービスプリンシパルを作成します。 Azure Databricks は、このサービスプリンシパルを使用して、要求されたメンテナンス処理を実行します。「サービスプリンシパルを管理する」を参照してください。

アカウントの予測最適化を有効または無効にする

アカウント管理者は、次の手順を実行して、アカウント内のすべてのメタストアの予測最適化を有効にすることができます。アカウント内のオブジェクトは、既定でこの設定を継承します (ただし、設定はカタログレベルまたはスキーマレベルでオーバーライドできます)。

アカウントコンソールにアクセスします。
[設定]、[機能の有効化] の順に移動します。
予測最適化の横にある使用するオプション (例えば、有効) を選択します。

Note

予測最適化をサポートしていないリージョンのメタストアは有効になりません。
アカウントレベルで予測最適化を無効にしても、明示的に有効にしたカタログまたはスキーマでは無効になりません。

カタログまたはスキーマ向けの予測最適化を有効または無効にする

予測最適化は継承モデルを使用します。カタログに対して有効にすると、スキーマはこのプロパティを継承します。有効になったスキーマ内のテーブルは、予測最適化を継承します。この継承動作をオーバーライドするには、カタログまたはスキーマの予測最適化を明示的に有効または無効にします。

Note

予測最適化は、アカウントレベルで有効にする前に、カタログレベルまたはスキーマレベルで無効にすることができます。後でアカウントで予測最適化を有効にすると、これらのオブジェクト内のテーブルに対してブロックされます。

予測最適化を有効または無効にしたり、親オブジェクトから継承する既定値に戻したりするには、次の構文を使用します。

ALTER CATALOG [catalog_name] { ENABLE | DISABLE | INHERIT } PREDICTIVE OPTIMIZATION;
ALTER { SCHEMA | DATABASE } schema_name { ENABLE | DISABLE | INHERIT } PREDICTIVE OPTIMIZATION;

予測最適化が有効かどうかをチェックする

Predictive Optimization フィールドは、予測最適化が有効かどうかを詳細に示す Unity Catalog プロパティです。予測最適化を親オブジェクトから継承している場合、これはフィールド値に示されます。

予測最適化が有効になっているか確認するには、次の構文を使用します。

DESCRIBE (CATALOG | SCHEMA | TABLE) EXTENDED name

予測最適化を追跡するためにシステムテーブルを使用する

Azure Databricks は、予測最適化操作の履歴を追跡するシステムテーブルを提供します。「予測最適化システムテーブル参照」を参照してください。

プライベートリンクのエラーメッセージ

システムテーブルで、操作が FAILED: PRIVATE_LINK_SETUP_ERROR で失敗としてマークされている場合、サーバーレスコンピューティング用にプライベートリンクが正しく構成されていない可能性があります。「サーバーレスコンピューティングからのプライベート接続を構成する」を参照してください。

制限事項

予測最適化は、すべてのリージョンで使用できるわけではありません。「Azure Databricks のリージョン」を参照してください。

予測最適化では、Z オーダーを使用するテーブルに対して OPTIMIZE コマンドを実行しません。

予測最適化では、ファイル保持期間が既定の 7 日間を下回って構成されたテーブルに対する VACUUM 操作は実行されません。「タイムトラベルクエリのデータ保持を構成する」を参照してください。

予測最適化は、次のテーブルのメンテナンス操作を実行しません。

Delta 共有の受信者としてワークスペースに読み込まれたテーブル。
外部テーブル。
具体化されたビュー。「Databricks SQL の具体化されたビューを使用する」を参照してください。
ストリーミングテーブル。「Databricks SQL でストリーミングテーブルを使用してデータを読み込む」を参照してください。

次の方法で共有

Unity Catalog 管理テーブルの予測最適化

予測最適化ではどのような操作を行いますか?

予測最適化はどこで行われますか?

予測最適化の前提条件

予測最適化を有効にする

アカウントの予測最適化を有効または無効にする

カタログまたはスキーマ向けの予測最適化を有効または無効にする

予測最適化が有効かどうかをチェックする

予測最適化を追跡するためにシステムテーブルを使用する

プライベートリンクのエラーメッセージ

制限事項

フィードバック

その他のリソース

次の方法で共有

Unity Catalog 管理テーブルの予測最適化

予測最適化ではどのような操作を行いますか?

予測最適化はどこで行われますか?

予測最適化の前提条件

予測最適化を有効にする

アカウントの予測最適化を有効または無効にする

カタログまたはスキーマ向けの予測最適化を有効または無効にする

予測最適化が有効かどうかをチェックする

予測最適化を追跡するためにシステム テーブルを使用する

プライベート リンクのエラー メッセージ

制限事項

フィードバック

その他のリソース

予測最適化を追跡するためにシステムテーブルを使用する

プライベートリンクのエラーメッセージ