Microsoft Purview でデータ ソースをスキャンする
Microsoft Purview では、 データ ソースを登録した後、ソースをスキャンして技術的なメタデータをキャプチャし、スキーマを抽出し、データに分類を適用できます。
- スキャン全般の詳細については、 スキャンの概念に関する記事を参照してください。
- ベスト プラクティスについては、スキャンのベスト プラクティスに関する記事を参照してください。
この記事では、データ ソースをスキャンするための基本的な手順について説明します。
ヒント
各ソースには、独自の手順とスキャンの前提条件があります。 最も完全なスキャン手順については、 サポートされているソースの一覧からソース を選択し、そのスキャン手順を確認します。
前提条件
Microsoft Purview で現在登録およびスキャンできるすべてのソースの一覧を次に示します。
データ ソースをスキャンする前に、次の手順を実行する必要があります。
- データ ソースを登録する - これは基本的に Microsoft Purview にデータ ソースのアドレスを提供し、Microsoft Purview データ マップのコレクションにマップします。
- ネットワークを検討する - ソースがオンプレミス ネットワークまたは仮想プライベート ネットワーク (VPN) 内にある場合、または Microsoft Purview アカウントでプライベート エンドポイントを使用している場合は、セルフホステッド統合ランタイムが必要です。これは、スキャン中にソースと Microsoft Purview が接続できるように、プライベート ネットワーク内のマシン上に置かれるツールです。 セルフホステッド統合ランタイムを作成する手順を次に示します。
- ソースへの接続に使用する資格情報を検討します。 すべての ソース ページ には、[ スキャン ] セクションがあり、使用可能な認証の種類に関する詳細が含まれます。
スキャンを作成する
次の手順では、例として Azure Blob Storage を使用し、Microsoft Purview マネージド ID を使用して認証します。
重要
これらはスキャンを作成するための一般的な手順ですが、 ソース固有の 事前要求とスキャンの手順についてはソース ページを参照する必要があります。
次の方法で Microsoft Purview ガバナンス ポータルを開きます。
- Microsoft Purview アカウントに https://web.purview.azure.com 直接移動して選択します。
- Azure portalを開き、Microsoft Purview アカウントを検索して選択します。 [Microsoft Purview ガバナンス ポータル] ボタンを選択します。
[データ マップ] ->[ソース] に移動して、マップ ビューまたはテーブル ビューで登録済みのソースを表示します。
ソースを見つけて、[ 新しいスキャン ] アイコンを選択します。
スキャンの [名前] を指定します。
認証方法を選択します。 ここでは、Purview MSI (マネージド ID) を選択しました。
現在のコレクション、またはスキャンのサブ コレクションを選択します。 選択したコレクションには、スキャン中に検出されたメタデータが格納されます。
[ 接続のテスト] を選択します。 成功しない場合は、「トラブルシューティング」セクションを参照してください。 接続に成功したら、[続行] を選択 します。
ソースに応じて、スキャンの範囲を特定のデータのサブセットにすることができます。 Azure Blob Storageの場合は、リスト内の適切な項目を選択することで、フォルダーとサブフォルダーを選択できます。
スキャン ルール セットを選択します。 スキャン ルール セットには、スキャンでチェックされるデータ分類の種類が含まれています。 システムの既定値 (ソースで使用できるすべての分類が含まれます)、organization内の他のユーザーによって行われた既存のカスタム ルール セット、またはインラインで新しいルール セットを作成することができます。
スキャン トリガーを選択します。 スケジュール (月単位または週単位) を設定することも、スキャンを 1 回実行することもできます。
注:
で繰り返しを開始 するには、 スケジュール スキャン時間より少なくとも 1 分短くする必要があります。それ以外の場合は、次回の繰り返しでスキャンがトリガーされます。
スキャンを確認し、[ 保存して実行] を選択します。
スキャンを表示する
データ ソース内のデータ量によっては、スキャンの実行に時間がかかる場合があるため、進行状況をチェックし、スキャンが完了したときに結果を確認する方法を次に示します。
スキャンはコレクションから、またはソース自体から表示できます。
コレクションから表示するには、データ マップの [コレクション ] に移動し、[ スキャン ] ボタンを選択します。
スキャン名を選択して詳細を表示します。
または、コレクション内のデータ ソースに直接移動し、[詳細の表示] を選択してスキャンの状態をチェックすることもできます。
スキャンの詳細は、前回の実行状態でのスキャンの進行状況と、スキャンおよび分類された資産の数を示します。
スキャン全体が正常に実行されると、[ 最終実行] 状態 が [進行中 ] に更新され、[ 完了] に更新されます
スキャンを管理する
スキャンが完了すると、そのスキャンを管理または再実行できます。
コレクションの一覧またはソース ページから [ スキャン名 ] を選択して、スキャンを管理します。
スキャンをもう一度実行し、スキャンを編集し、スキャンを削除できます
フル スキャンを実行すると、スコープ内のすべてのコンテンツがスキャンされますが、一部のソースでは 増分スキャン も使用できます。 増分スキャンでは、前回のスキャン以降に更新されたリソースのみがスキャンされます。 ソース ページで サポートされている機能 テーブルを確認して、最初のスキャン後にソースで増分スキャンを使用できるかどうかを確認します。
トラブルシューティング
スキャンの接続の設定は、ネットワークと資格情報のカスタム 設定であるため、複雑になる可能性があります。
ソースに接続できない場合は、次の手順に従います。
- ソース ページの前提条件を確認して、見逃したことがないことを確認します。
- ソース ページの [スキャン ] セクションで認証オプションを確認して、認証方法が正しく設定されていることを確認します。
- [ 接続のトラブルシューティング] ページを確認します。
- サポート リクエストを作成して、サポート チームが特定の環境のトラブルシューティングを支援できるようにします。