EDM SIT サンプル ファイルを作成する (新しいエクスペリエンス)

正確なデータ一致 (EDM) ベースの機密情報の種類 (SIT) を作成して使用できるようにするのは、複数フェーズのプロセスです。 これらは、Microsoft Purview データ損失防止ポリシー、電子情報開示、および特定のコンテンツ ガバナンス タスクで使用できます。

ヒント

E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview コンプライアンス ポータルのトライアル ハブで今すぐ開始してください。 サインアップと試用期間の詳細については、こちらをご覧ください。

適用対象

  • 新しいエクスペリエンス

クラシック エクスペリエンスを使用して EDM SIT を作成する場合は、「 EDM SIT クラシック エクスペリエンスを作成する」を参照してください。

開始する前に

サンプル ファイルの書式設定

システムは、スキーマを作成するためにサンプル ファイルから列名を抽出し、サンプル フィールド データをマップするための基本 SID を推奨します。 ソース機密情報テーブル ファイルと同じ形式にする必要があり、実際のデータを表す合成値を含める必要があります。 ファイルは 、.csv (コンマ区切り値)、 .tsv (タブ区切り値)、またはパイプ区切り (|) 形式で保存できますが、実際のソース機密情報テーブル ファイルと同じにする必要があります。 .tsv 形式は、データ値に番地などのコンマが含まれている場合に推奨されます。

  • 約 10 から 20 行のデータを使用して、システムで使用できる十分なサンプルがあることを確認します。
  • コンマを含むフィールド値は、引用符で囲む必要があります "
  • 最初の行はヘッダー行で、列名を含む必要があります。
  • ファイルには、少なくとも 1 行のデータが含まれている必要があります。
  • データの各行には、ヘッダーに対応する正しい数のフィールドが含まれている必要があります。
  • サンプル ファイルには、最大 32 個の列を含めることができます。
  • サンプル ファイルのサイズは 2.5 MB を超えることはできません。
  • 列 (フィールド) 名は、文字で始まり、3 文字以上で構成され、英数字 (A- Z、a-z、0- 9) のみで構成され、スペース、アンダースコア、またはその他の特殊文字を含めることはできません。

たとえば、実際のデータでタブ区切り (.tsv) 形式が使用されていて、次のようになります。

4 つの列と 3 行の人工的な実データのデータを含むタブ区切りテーブルを示す画像

その後、サンプル ファイルには同じ列ヘッダーが必要ですが、次のように行に合成値を使用します

FirstName LastName PatientNumber CreditCardNumber
エリック ソロモン 987-65-4321 9000000000000000
リサ テイラー 123-45-6789 500000000000000
アンドレ ローソン 234-56-7890 200000000000000

サンプル ファイル テンプレートの使用方法

米国医療、米国金融サービス、または米国保険業界の業種の場合は、次のサンプル ファイル テンプレートから開始して、サンプル ファイルの作成プロセスを高速化できます。 これらのファイルには、各業界で最も一般的に使用される列ヘッダーと、フィールド内の合成値が含まれています。

これらのテンプレートを使用するには:

  1. 業界のサンプル ファイル テンプレートをダウンロードします。
  2. テンプレート内の列ヘッダーを実際のソース データと比較し、カスタマイズしたサンプル ファイルのプライマリ フィールドとして使用する列ヘッダーを選択します。
  3. 実際のソース データの書式設定と合成値の書式設定を比較します。 ソース データ値の書式設定に合わせて合成値の書式設定を変更します。
  4. EDM SIT スキーマとルール パッケージを作成するときに使用するカスタマイズしたサンプル ファイルを保存します。

ヒント

新しいエクスペリエンスで作業する場合は、サンプル ファイルをアップロードするか、サンプル ファイルの値を手動で入力するオプションがあります。 サンプル ファイルを作成することをお勧めします。

次の手順