Microsoft Purview で Cassandra に接続して管理する

この記事では、Cassandra を登録する方法と、Microsoft Purview で Cassandra を認証して操作する方法について説明します。 Microsoft Purview の詳細については、 入門記事を参照してください。

サポートされている機能

メタデータ抽出 フル スキャン 増分スキャン スコープスキャン 分類 ラベル付け アクセス ポリシー 系統 データ共有 ライブ ビュー
はい いいえ はい いいえ 不要 不要 はい いいえ 不要

サポートされている Cassandra サーバーのバージョンは 3 です。x または 4。x

Cassandra ソースをスキャンする場合、Microsoft Purview では次の処理がサポートされます。

  • 以下を含む技術的なメタデータの抽出:

    • クラスター
    • Keyspaces
    • 列とインデックスを含むテーブル
    • 列を含む具体化されたビュー
  • テーブルと具体化されたビュー間の資産リレーションシップに対する静的系列をフェッチする。

スキャンを設定するときに、Cassandra インスタンス全体をスキャンするか、指定された名前または名前パターンに一致するキースペースのサブセットにスキャンのスコープを設定するかを選択できます。

既知の制限

オブジェクトがデータ ソースから削除された場合、現在、後続のスキャンでは、Microsoft Purview の対応する資産は自動的に削除されません。

前提条件

注:

データ ストアにパブリックにアクセスできない場合 (データ ストアでオンプレミス ネットワーク、プライベート ネットワーク、または特定の IP からのアクセスが制限されている場合)、 セルフホステッド統合ランタイムを構成して接続する必要があります。

  • データ ストアにパブリックにアクセスできない場合は、最新の セルフホステッド統合ランタイムを設定します。 詳細については、 セルフホステッド統合ランタイムの作成と構成に関するガイドを参照してください。
    • セルフホステッド統合ランタイムがインストールされているマシンに JDK 11 がインストールされていることを確認します。 JDK を新しくインストールして有効にした後、マシンを再起動します。
    • Visual C++ 再頒布可能パッケージ (バージョン Visual Studio 2012 Update 4 以降) がセルフホステッド統合ランタイム コンピューターにインストールされていることを確認します。 この更新プログラムがインストールされていない場合は、 こちらからダウンロードできます

登録

このセクションでは、 Microsoft Purview ガバナンス ポータルを使用して、Microsoft Purview に Cassandra を登録する方法について説明します。

登録手順

データ カタログに新しい Cassandra サーバーを登録するには:

  1. 次の方法で Microsoft Purview ガバナンス ポータルを開きます。

  2. 左側のウィンドウで [ データ マップ ] を選択します。

  3. [登録] を選択します。

  4. [ ソースの登録 ] 画面 で、[Cassandra] を選択し、[続行] を選択 します

    [ソースの登録] 画面を示すスクリーンショット。

  5. [ ソースの登録 (Cassandra)] 画面で、次の手順を実行します。

    1. 名前 を入力します。 データ ソースでは、カタログでこの名前が使用されます。
    2. [ ホスト ] ボックスに、Cassandra サーバーが実行されているサーバー アドレスを入力します。 たとえば、20.190.193.10 などです。
    3. [ ポート ] ボックスに、Cassandra サーバーで使用されるポートを入力します。
    4. コレクションを選択するか、新しいコレクションを作成します (省略可能)。 [ソースの登録 ] (Cassandra) 画面を示すスクリーンショット。
    5. [登録] を選択します。

スキャン

Cassandra をスキャンして資産を自動的に識別するには、次の手順に従います。 スキャン全般の詳細については、スキャンとインジェストの概要に関するページを参照してください。

スキャンの作成と実行

新しいスキャンを作成して実行するには:

  1. サーバーにパブリックにアクセスできる場合は、手順 2 に進みます。 それ以外の場合は、セルフホステッド統合ランタイムが構成されていることを確認する必要があります。

    1. Microsoft Purview ガバナンス ポータルで、管理センターに移動し、[統合ランタイム] を選択します。
    2. セルフホステッド統合ランタイムが使用可能であることを確認します。 設定されていない場合は、 ここで 説明する手順を使用して、セルフホステッド統合ランタイムを設定します。
  2. Microsoft Purview ガバナンス ポータルで、[ソース] に移動します。

  3. 登録済みの Cassandra サーバーを選択します。

  4. [ 新しいスキャン] を選択します。

  5. 次の詳細を指定します。

    1. [名前]: スキャンの名前を指定します。

    2. 統合ランタイム経由で接続する: サーバーがパブリックにアクセス可能な場合は Azure 自動解決統合ランタイムを選択し、一般公開されていない場合は構成済みのセルフホステッド統合ランタイムを選択します。

    3. 資格情報: Cassandra 資格情報を構成するときは、次の手順を実行してください。

      • 認証方法として [ 基本認証 ] を選択します。
      • [ ユーザー名 ] ボックスに、接続するユーザーの名前を指定します。
      • キー コンテナーのシークレットで、接続する Cassandra ユーザーのパスワードを保存します。

      詳細については、「 Microsoft Purview でのソース認証の資格情報」を参照してください。

    4. Keyspaces: インポートする Cassandra キースペースの一覧を指定します。 複数のキースペースはセミコロンで区切る必要があります。 たとえば、keyspace1 です。keyspace2。 リストが空の場合、使用可能なすべてのキースペースがインポートされます。

      % を含む SQL LIKE 式構文を使用する keyspace 名パターンを使用できます。

      例: A%;%B;%C%;D

      この式は、次のことを意味します。

      • A または で始まる
      • B または で終わる
      • C または が含まれています
      • D と等しい

      NOT または特殊文字は使用できません。

    5. Secure Sockets Layer(SSL)を使用する: Cassandra サーバーに接続するときに Secure Sockets Layer (SSL) を使用するかどうかを指定するには、[ True] または [ False] を 選択します。 既定では、このオプションは False に設定 されています

    6. 使用可能な最大メモリ (セルフホステッド統合ランタイムを使用する場合に適用可能): スキャン プロセスに使用する VM で使用できる最大メモリ (GB 単位) を指定します。 この値は、スキャンする Cassandra サーバーのサイズによって異なります。 cassandra ソースをスキャンする

  6. [ 接続のテスト] を選択して、設定を検証します。

  7. [続行] を選択します。

  8. スキャン トリガーを選択します。 スケジュールを設定することも、スキャンを 1 回実行することもできます。

  9. スキャンを確認し、[保存して 実行] を選択します。

スキャンとスキャンの実行を表示する

既存のスキャンを表示するには:

  1. Microsoft Purview ガバナンス ポータルに移動します。 左側のウィンドウで、[ データ マップ] を選択します。
  2. データ ソースを選択します。 [最近のスキャン] で、そのデータ ソースの既存の スキャンの一覧を表示したり、[ スキャン ] タブですべてのスキャンを表示したりできます。
  3. 表示する結果を含むスキャンを選択します。 このウィンドウには、以前のすべてのスキャン実行と、各スキャン実行の状態とメトリックが表示されます。
  4. 実行 ID を選択して、スキャン実行の詳細をチェックします

スキャンを管理する

スキャンを編集、取り消し、または削除するには:

  1. Microsoft Purview ガバナンス ポータルに移動します。 左側のウィンドウで、[ データ マップ] を選択します。

  2. データ ソースを選択します。 [最近のスキャン] で、そのデータ ソースの既存の スキャンの一覧を表示したり、[ スキャン ] タブですべてのスキャンを表示したりできます。

  3. 管理するスキャンを選択します。 次のことを実行できます。

    • [スキャンの編集] を選択して スキャンを編集します
    • [スキャンの実行の取り消し] を選択して、進行中 のスキャンを取り消します
    • [スキャンの削除] を選択して スキャンを削除します

注:

  • スキャンを削除しても、以前のスキャンから作成されたカタログ資産は削除されません。
  • ソース テーブルが変更され、Microsoft Purview の [スキーマ] タブで説明を編集した後にソース テーブルを再スキャンした場合、資産は スキーマ の変更で更新されなくなります。

系統

Cassandra ソースをスキャンした後、 データ カタログを参照 するか 、データ カタログを検索 して資産の詳細を表示できます。

[資産 -> 系列] タブに移動すると、該当する場合に資産関係を確認できます。 サポートされている Cassandra 系列のシナリオについては、サポートされている機能に関するセクションを参照してください。 系列全般の詳細については、「データ系列と系列ユーザー ガイド」を参照してください。

Cassandra 系列ビュー

次の手順

ソースを登録したので、次のガイドに従って、Microsoft Purview とデータの詳細を確認してください。