機密情報の種類と完全に一致するデータをテストする

ヒント

E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview コンプライアンス ポータルのトライアル ハブで今すぐ開始してください。 サインアップと試用期間の詳細については、こちらをご覧ください。

適用対象

正確なデータ一致 (EDM) 機密情報の種類 (SIT) が作成され、機密情報テーブルのアップロードとインデックス作成が完了したことを確認してから 1 時間後に、Microsoft Purview コンプライアンス ポータルの [機密情報の種類] セクションの [テスト] 関数を使用して、保護する情報が検出されたかどうかをテストできます。

注:

既存の EDM SIT の変更がシステム全体に反映されるまでに時間がかかる場合があります。 検出の問題をトラブルシューティングするために EDM SIT に変更を加える場合は、 テスト 関数を使用して影響を検証する前に、それらの変更を行ってから少なくとも 1 時間待ってください。

テストに使用する方法に関係なく、テスト結果には、特定の EDM SIT と、その EDM SIT 用に構成されている主要な要素の両方の一致が含まれます。

EDM SIT をテストするためのメソッド

EDM SIT のテストに使用できる方法は 2 つあります。

メソッド 新しい EDM エクスペリエンスで利用可能 新しい EDM およびクラシック EDM エクスペリエンスで利用できます
機密情報の種類 (SIT) メソッド はい 必要
EDM 分類子メソッド 必要 いいえ

注:

クラシック EDM エクスペリエンスを使用している場合は、SIT メソッドを使用する必要があります。

機密情報の種類メソッドを使用した EDM SIT のテスト

機密情報の種類メソッドを使用して EDM SIT をテストするには、次の手順を実行します。

現在使用しているポータルに該当するタブを選択してください。 Microsoft Purview ポータルの詳細については、Microsoft Purview ポータルを参照してください。 コンプライアンス ポータルの詳細については、「Microsoft Purview コンプライアンス ポータル」を参照してください。

  1. Microsoft Purview ポータル>Information Protection>Classifiers>Sensitive info types にサインインします。

  2. 一覧から EDM SIT を選択し、[ テスト ] アイコンを選択します。

  3. ポップアップ ウィンドウで、検出するデータを含むファイルをアップロードします。 たとえば、機密情報テーブル内の行のサブセットを含むファイルを作成します。 スキーマで 構成可能な一致 機能を使用して無視される区切り記号を定義した場合は、サンプル ファイルに、これらの区切り記号を含む、または含まない例が含まれていることを確認します。

  4. [ テスト] を選択します。

  5. ファイルがアップロードされてスキャンされたら、EDM SIT に一致するかどうかを確認します。

  6. SIT の Test 関数が一致を検出した場合は、SIT でトリミングされていないか、一致した項目が正しく抽出されていないことを確認します。 一般的な問題には、次のような SID が含まれます。

    • 検出する必要がある完全な文字列の部分文字列のみを抽出する
    • 複数単語文字列の最初の単語のみを選択する
    • 抽出に余分な記号または文字を含める

正規表現の使用の詳細については、「正規表現 言語 - クイック リファレンス」を参照してください

EDM 分類子メソッドを使用して EDM SIT をテストする

現在使用しているポータルに該当するタブを選択してください。 Microsoft Purview ポータルの詳細については、Microsoft Purview ポータルを参照してください。 コンプライアンス ポータルの詳細については、「Microsoft Purview コンプライアンス ポータル」を参照してください。

  1. Microsoft Purview ポータル>Information Protection>Classifiers>EDM 分類子にサインインします。

  2. [新しい EDM エクスペリエンス] トグルが [オン] に設定されていることを確認します。

  3. 一覧から EDM SIT を選択し、[ テスト ] アイコンを選択します。

  4. 検出するデータを含むファイルをアップロードします。 たとえば、機密情報テーブル内の行のサブセットを含むファイルを作成します。 スキーマで 構成可能な 一致機能を使用して無視される区切り記号を定義した場合は、サンプル ファイルに、これらの区切り記号の有無に関する例が含まれていることを確認してください。

  5. ファイルがアップロードされてスキャンされたら、EDM SIT に一致するかどうかを確認します。

  6. SIT の Test 関数が一致を検出した場合は、SIT でトリミングされていないか、一致した項目が正しく抽出されていないことを確認します。 一般的な問題には、次のような SID が含まれます。

    • 検出する必要がある完全な文字列の部分文字列のみを抽出する
    • 複数単語文字列の最初の単語のみを選択する
    • 抽出に余分な記号または文字を含める

PowerShell を使用して EDM SIT をテストする

PowerShell を使用してテストするには、次の PowerShell コマンドレットを使用します。

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

テストに使用する方法に関係なく、テスト結果には、特定の EDM SIT と、その EDM SIT 用に構成されている主要な要素の両方の一致が含まれます。

注:

EDM の機密情報の種類または EDM の種類の基になるプライマリ SIT を作成または編集すると、新しい定義に一致するコンテンツに対して、すべての新しいコンテンツ (および SID を変更した後に変更されたコンテンツ) がクロールされます。 ただし、既存のコンテンツは、変更または再インデックスが作成されるまでクロールされません。

SharePoint サイトまたはライブラリ、または OneDrive 内の既存のコンテンツを強制的に再クロールするには、「 サイト、ライブラリ、またはリストのクロールとインデックス再作成を手動で要求する」の手順に従います。

情報保護ポリシーを使用して EDM SIT をテストする

EDM SIT が使用されている場所と、運用環境での正確さを確認するには、ポリシーで使用します。

  1. 自動ラベル付けポリシーを作成し、シミュレーションの概要で実行します。

  2. EDM SIT をトリガーするコンテンツと、EDM SIT をトリガーしないコンテンツを、ポリシーが監視している場所に追加します。

  3. [ 確認するアイテム ] タブを開き、一致を確認します。

  4. 必要に応じてポリシーを調整します。

テストとチューニングの結果に満足したら、EDM ベースのカスタム SIT を情報保護ポリシーで使用できます(例:

トラブルシューティングのヒント

EDM SIT でデータ内の一致が検出されない場合は、次のヒントが問題の診断に役立つ可能性があります。

問題 トラブルシューティングのヒント
一致が見つかりません 「ハッシュ」で説明されているコマンドを使用して機密データが正しくアップロードされたことを確認 し、機密情報の種類と完全に一致する機密情報のソース テーブルをアップロードします
一致が見つかりません 各パターンでプライマリ要素を構成したときに使用した SIT をテストします。 このテストでは、SIT が項目内の例と一致するかどうかを確認します。 誤って定義された SIT を EDM SIT の分類要素として使用することが、EDM での検出エラーの最も一般的な原因です。
EDM 型のプライマリ要素に対して選択した SIT で、項目に一致するものが見つからないか、予想よりも少ない一致が見つかりません SIT で、コンテンツ内で発生する区切り記号と区切り記号がサポートされていることを確認します。 スキーマで定義されている無視された区切り記号を必ず含めます。
プライマリ要素に関連付けられている SIT は、コンテンツ内の一致を検出しますが、EDM SIT は見つかりません。
  • REGEX ステートメントが、検出する項目の先頭または末尾に空白区切り記号をキャッチしているかどうかを確認します。 たとえば、 \s 区切り記号を含むステートメントを探します。 空白区切り記号が含まれている場合、空白文字はデータ テーブルのハッシュ値と一致しません。 代わりに、 \bなどの単語区切り記号を使用します。
  • REGEX ステートメントを調べて、部分文字列だけでなく、検出する文字列全体がキャプチャされていることを確認します。 たとえば、電子メール アドレスのこのパターンを考えてみましょう: \b[a-zA-Z]{2,30}@[a-zA-Z]{2,20}.[a-zA-Z]{2,3}\b。 このパターンは user@contoso.comと正しく一致しますが、不完全な形式でのみ user@contoso.co.jp をキャプチャします。
プライマリ要素を含む EDM SIT では、定義されたセカンダリ要素はありませんが、プライマリ要素とセカンダリ要素の両方が必要な場合は、一致が検出されません (または、予想よりも少ない一致が検出されます)。 セカンダリ証拠に使用される列の値が、スペース、コンマ、またはその他の単語区切り記号を含まない 1 つの単語または文字列で構成されていない場合、テストする方法は 2 つあります。
  1. マルチトークン マッチング オプションを選択します
  2. 必要なパターンに従う複数単語文字列 (大文字で始まる連続する単語の固定数など) を検出するように設計された REGEX または、その列内のすべての一意の値を一覧表示するキーワード ディクショナリを使用する SIT に値を関連付けます。 たとえば、人の市区町村や住居の追加の証拠列がある場合は、テーブルのすべての一意の都市名を含むリストを作成し、それを使用して辞書ベースの機密情報の種類を作成できます。

XML で EDM SIT 定義をエクスポートおよび編集することで、この SIT を EDM SIT 内の対応する列の分類要素として使用します。 詳細については、「 ルール パッケージを手動で作成する」を参照してください。
SIT テスト関数では、一致がまったく検出されません。 選択した SIT に、追加のキーワードやその他の検証の要件が含まれていることを確認します。 組み込みの SID については、「 機密情報の種類のエンティティ定義 」を参照して、各型に一致するための最小要件を決定します。
テスト機能は機能しますが、SharePoint または OneDrive 項目が DLP または自動ラベル付けルールで検出されない コンテンツ エクスプローラーに一致するドキュメントが実際に表示されることを確認します。 一致は、SIT への変更が適用 された後 に作成されたコンテンツでのみ検出されます。 そのため、予想される一致が表示されない場合は、既存のアイテムのサイトとライブラリを再クロールします。 SharePoint と OneDrive の再クロールの詳細については、「サイト、 ライブラリ、またはリストのクロールとインデックス再作成を手動で要求する」を参照してください。
複数の一致を必要とする DLP または自動ラベル付けルールがトリガーされない EDM SIT と基本 SID の両方の近接要件が満たされていることを確認します。 たとえば、プライマリ要素とサポート キーワードの間の最大距離が 300 文字であるのに、キーワードが長いテーブルの最初の行にのみ存在する場合、一致する値の最初の数行のみが近接要件を満たす可能性があります。 よりリラックスした近接ルールをサポートするように SIT 定義を変更するか、追加の証拠条件に ドキュメントオプションの Anywhere を使用します。
EDM SIT の検出に一貫性がない、または不規則である EDM SIT のプライマリ要素のベースとして使用した SIT が不要なコンテンツを検出していないことを確認します。 任意の単語、任意の番号、またはすべてのメール アドレスなど、関連性のないコンテンツに一致しすぎる SIT を使用すると、サービスが関連する一致を無視する可能性があります。 コンテンツ エクスプローラーで主要な要素に使用した機密の種類と一致するコンテンツピースの数を確認します。

SIT が一致するコンテンツが多すぎるかどうかを見積もるには:
  1. Microsoft Purview コンテンツ エクスプローラーのコンテンツ 項目の数を、機密の種類が作成されてからの日数で除算します。
  2. 1 日あたりの一致数が数十万以上の範囲にある場合、プライマリ SIT が広すぎる可能性があります。

EDM SIT に適した機密情報の種類を選択するための推奨事項とベスト プラクティスについては、「 正確なデータ一致ベースの機密情報の種類について学習する」を参照してください。