AI/BI Genie スペースとは
重要
この機能はパブリック プレビュー段階にあります。 Databricks アシスタントがアカウント レベルで有効になっている場合、ワークスペース管理者は[プレビュー] ページからこの機能を有効にできます。 「Azure Databricks プレビューを管理する」を参照してください。
AI/BI Genie は、DatabricksIQ を搭載したノー コード インターフェイスであり、ビジネス ユーザーは自然言語を使用してセルフサービス データ分析を実行できます。 データ アナリストなどの分野の専門家は、Genie スペースをデータセット、サンプル クエリ、テキスト ガイドラインを使って構成し、Genie がビジネスの質問を分析クエリに変換することを支援できます。 設定後、ビジネス ユーザーは質問をしたり、視覚化を生成したりして、オペレーショナル データを理解できます。 Genie は、データが変化し、ユーザーが新しい質問を出すにつれて、セマンティック知識を継続的に更新します。 「DatabricksIQ を利用した機能」をご覧ください。
データ アナリストは、次の手順に従って、ビジネス ユーザー向けにドメイン固有の Genie スペース エクスペリエンスを準備できます。
- Unity カタログから関連するテーブルを選択し、Genie スペースでメタデータ (テーブルと列の説明) を公開します。
- 組織固有の情報 (ビジネス ロジックとメタデータ) を Genie スペースに転送する手順を追加します。
初期セットアップ後、ユーザーは、検証済みの SQL 回答を手順として保存して、データとセマンティクスに関する Genie の理解を徐々に向上させることができます。 「指示を提供する」を参照してください。
ユース ケースの例
異なる Genie スペースを作成して、さまざまな非技術的な対象ユーザーにサービスを提供できます。 以下のシナリオで、考えられる 2 つのユース ケースについて説明します。
営業案件の状態を視覚化する
営業マネージャーは、営業パイプラインの段階別に、進行中の案件と終了した案件の現在の状態を取得したいと考えています。 自然言語を使用して Genie スペースと対話し、視覚化を自動的に生成できます。
次の gif は、この対話を示しています。
物流の追跡
ある物流会社は、Genie スペースを使用して、さまざまな部門のビジネス ユーザーが運用と財務の詳細を追跡できるようにしたいと考えています。 出荷施設のマネージャーが出荷を追跡するための Genie スペースを 1 つ設定し、もう 1 つは財務役員が財務の正常性を把握できるように設定しました。
Genie スペースの応答はどのように生成されるのか
Genie スペースは、テーブルと列の名前と説明を使用して、自然言語の質問に対する応答を生成します。 テーブル内の実際のデータは Genie には表示されません。
AI/BI Genie は、名前と説明を使って、自然言語の質問を同等の SQL クエリに変換します。 次に、そのクエリの結果をテーブルとして応答します。 Genie スペースの作成者とビジネス ユーザーは、各応答を作成するために生成された SQL クエリを調べることができます。
技術的な要件
- Genie スペースでは、Unity カタログに登録されたデータが使用されます。
- Genie スペースには、プロまたはサーバーレス SQL のウェアハウスが必要です。
- 各ワークスペースは、最大で 1,000 個の Genie スペースを含むことができます。
必要なアクセス許可
Genie スペースを作成、編集、使用するには、次のアクセス許可が必要です。
Note
データとコンピューティング アクセスを構成するには、昇格されたアクセス許可 (通常は管理者に制限される) が必要です。 「SQL ウェアハウスの作成」および「Unity Catalog での権限の管理」を参照してください。
- コンピューティングのアクセス許可: 作成者、編集者、ユーザーは、スペースに指定された既定の SQL ウェアハウスへの CAN USE アクセスを必要とします。 作成者は、スペースを作成するときに既定の SQL ウェアハウスを選択します。 作成者は、CAN RUN アクセス許可を持つ任意の SQL ウェアハウスを選択できます。
- データのアクセス許可: スペースを操作するすべてのユーザーには、スペースで使用されるデータに対する少なくとも
SELECT
特権が必要です。 - Genie スペース アクセス許可: ユーザーは、Genie とスペース内で使用されるデータと対話するために、Genie スペースに対する CAN RUN アクセス許可が必要です。 Genie スペースの権限と機能の完全なマッピングについては、「Genie スペース ACL」を参照してください。
どのようなデータを使用する必要がありますか?
1 つ以上の Unity カタログのマネージド テーブルに基づいて、新しい Genie スペースを作成できます。 AI/BI Genie は、Unity Catalog のオブジェクトに添付されたメタデータを使って応答を生成します。 適切に注釈が付けられたデータセットと、指定した特定の手順を組み合わせることは、エンド ユーザーにとって肯定的なエクスペリエンスを作成するための鍵となります。
Azure Databricks では次を行うことを推奨しています。
- 分析での利用向けにデータをキュレーションする: 列の数を減らすようにビューを階層化し、ユース ケース固有の情報を追加して応答品質を向上させます。
- Genie スペース内のテーブルと列の数を最小限に抑える: 特定のドメインの質問に回答するために必要なテーブルと列のみを取り込みます。 不要なテーブルや列があると、Genie がわかりにくい回答や間違った回答を提供したり、エラー メッセージを表示したりする可能性があります。
新しい Genie スペースを作成する
新しい Genie スペースを作成すると、[新しいスペース] ダイアログに次のオプションが表示されます。
- タイトル: タイトルは、他のワークスペース オブジェクトと共にワークスペース ブラウザーに表示されます。 エンド ユーザーが Genie スペースを見つけやすくするタイトルを選択します。
- 説明: Genie スペースを開くとこの説明が表示されます。 このテキスト領域を使用して、スペースの目的を説明します。
- 既定のウェアハウス: このコンピューティング リソースにより、Genie スペースで生成された SQL ステートメントが実行されます。 エンド ユーザーは、スペースと対話できるように、このウェアハウスにアクセスする必要があります。 Genie スペースでは、Pro または Serverless SQL ウェアハウスを使用できます。 最適なパフォーマンスを得るため、Databricks では、サーバーレス SQL ウェアハウスを使用することをお勧めします。
- テーブル: Genie スペースは、1 つ以上のテーブルに基づいて作成できます。 最大で 25 個のテーブルを含めることができます。 [テーブルの追加] ボタンをクリックすると、含める Unity カタログ テーブルを選択できる新しいダイアログが開きます。
- サンプルの質問: サンプルの質問は省略可能です。 ユーザーが質問できる質問の種類の例を提供するために、チャットに表示されます。 これらは、作成時または後でスペースの [設定] から追加できます。
Genie スペースでチャットする
ほとんどの Genie スペースの対話はチャット ウィンドウで行われます。
新しいチャット ウィンドウには、厳選された一連のサンプル質問が含まれています。 これらのサンプルの質問は、ユーザーが Genie スペースでどのような質問をできるかを理解するのに役立ちます。 ユーザーが質問を入力するテキスト フィールドは、画面の下部付近にあります。
応答はテキスト フィールドの上に表示されます。 ユーザーが質問を入力すると、左側のウィンドウのチャット履歴スレッドに保存されます。
チャット履歴
チャット履歴スレッドは、過去の質問と回答を参照できるように、ユーザーごとに保存されます。 ユーザーは、チャット スレッドから質問を再送信または修正することもできます。 左側のウィンドウの [新しいチャット] ボタンをクリックすると、新しいスレッドが開始されます。
各チャット スレッドではそのコンテキストが維持されるため、アシスタントは以前に尋ねられた質問を考慮します。 これにより、ユーザーはフォローアップの質問をして、結果セットをさらに調査したり、再フォーカスしたりすることができます。
応答構造
正確な応答構造は、質問によって異なります。 多くの場合、応答には自然言語の説明と、関連する結果セットを示すテーブルが含まれています。 すべての応答には、質問に回答するために生成された SQL クエリが含まれます。 [Show generated code] (生成されたコードを表示) をクリックして、生成されたクエリを表示できます。
応答の右下には、オプションのアクションがあります。 応答 CSV をクリップボードにコピーしたり、CSV ファイルとしてダウンロードしたり、Genie スペースの命令として追加したり、回答の肯定または否定の投票をしたりできます。
一連のクイック アクションタイルが、表形式データを含む応答に続きます。 これらを使用して視覚化を生成できます。
クエリ結果を取得した後に、言葉で説明して視覚エフェクトを生成することもできます。
応答のフィードバックを提供する
AI/BI Genie の各応答には、サムアップまたはサムダウンのフィードバック ボタンが含まれます。 Databricks では、このメカニズムを使ってスペースに関するフィードバックを提供するようユーザーに促すことが推奨されています。 フィードバックを使用して、応答を調整し、スペースを反復処理できます。 [監視] ページからアクセスできます。 「スペースを監視する」を参照してください。
スペースを監視する
Genie スペースは、データ チームとビジネス ユーザーが 1 回限りのデプロイではなく、知識を蓄積するための継続的なコラボレーション ツールであることを目的としています。 ビジネス ユーザーが回答を必要としている新しい質問を理解することは、知識構築に不可欠です。 [監視] ページでは、個々の質問と回答のほか、スペースを操作するユーザーが提供するサムアップまたはサムダウンフィードバックを表示できます。 Genie スペースのサイド バーで [監視] をクリックして、監視ページを開きます。
[監視] ページには、スペースで質問されたすべての質問と回答が表示されます。 質問は、時間、評価、ユーザー、または状態でフィルター処理できます。 スペースを監視することで、Genie の作成者はビジネス ユーザーから出されたクエリと Genie スペースがどのように応答したかを積極的に理解できるようになります。
Genie が苦労している質問を特定することで、Genie スペースを特定の指示に更新して応答を改善できます。 質問をクリックして、質問と回答のテキストを開きます。 このビューから完全なチャット スレッドにアクセスすることもできます。
指示を提供する
指示は、特定のドメイン固有の専門用語、ロジック、概念を処理できるように、Genie の応答をガイドするのに役立ちます。 Genie がスペース ユーザーが質問する可能性のある質問に答えるのに役立つ、プレーン テキストのクエリまたはスニペットの例として指示を記述できます。 包括的な指示は、シームレスで直感的な Genie スペースのエクスペリエンスに不可欠です。
Genie スペースのサイド バーの [指示] クリックして、指示ウィンドウを開きます。
次の例は、さまざまな種類の指示をを示しています。
会社固有のビジネス情報:
- "当社の会計年度は 2 月から始まります"
値、エイリアス、または一般的なフィルター:
- "フィルターを適用するときは、常に小文字に変換し、like 演算子を使用します"
- "フィルター値の州には省略形を使用します"
Unity カタログで使用できるユーザー定義関数:
"四半期については、
adventureworks.oneb.get_quarter(date)
UDF を使用します。 get_quarter の出力は四半期を示し、1、2、3、または 4 のいずれかです。 これを使用して、必要に応じてデータをフィルター処理します。たとえば、第三四半期の場合は、where
adventureworks.oneb.get_quarter(posted_date)
= 3"` を使用します"
SQL クエリの例:
- Genie が生成することが想定されるクエリのサンプルを提供できます。
- 次の例のように、組織とデータに固有のロジックを強調するサンプルを提供することに重点を置きます。
-- Return our current total open pipeline by region. -- Opportunities are only considered pipelines if they are tagged as such. SELECT a.region__c AS `Region`, sum(o.amount) AS `Open Pipeline` FROM sales.crm.opportunity o JOIN sales.crm.accounts a ON o.accountid = a.id WHERE o.forecastcategory = 'Pipeline' AND o.stagename NOT ILIKE '%closed%' GROUP BY ALL;
Genie スペースの指示は、1 つの長いメモとして編成するか、関連するトピックごとにグループ化して分かりやすい構造にすることができます。
テキスト処理の制限
トークンは、Genie が言語の処理と理解に使用するテキストの基本的な単位です。 たとえば、命令として、またはメタデータに含まれるテキストは、トークンに変換されます。 各 Genie スペースには、質問ごとに約 14,000 トークンの制限があります。 この制限には、命令、サンプル SQL ステートメント、信頼できる資産、テーブル メタデータ (列名、説明、テーブル名、キー定義など)、以前のチャットの会話が含まれます。 Genie のスペースがこの制限に近づくか、超えた場合、製品から警告またはエラーが通知されます。
このエラーのトラブルシューティングについては、「トークン制限のために要求が処理されない」をご覧ください
生成された SQL を編集する
任意の応答で生成された SQL を確認して編集できます。 Genie スペースの作成者は通常、ドメインとデータのことを知っているため、Genie が誤った回答を生成しているかどうかを認識できます。 多くの場合、生成された SQL クエリを手で少し調整してエラーを修正できます。 応答に対して生成された SQL を表示するには、[生成されたコードの表示] をクリックしてクエリを検査します。
Genie スペースに対する CAN EDIT 以上の特権がある場合、生成された SQL ステートメントを編集して修正できます。 修正したら、クエリを実行します。 その後、それを指示として保存し、将来 Genie に回答方法を教えることができます。 編集したクエリを保存するには、 [指示として保存] をクリックします。
Genie スペースを共有する
重要
Genie スペースのユーザーは、自身の資格情報を使用してデータを操作する必要があります。 アクセスできないデータに関する質問に対しては、空の応答が生成されます。
Genie スペースのユーザーは、Genie スペースに接続されているウェアハウスに対する CAN USE アクセス許可と、スペース内に表示される Unity カタログ オブジェクトに対するアクセス許可を持っている必要があります。 「どのようなデータを使用する必要がありますか?」を参照してください。
新しい Genie スペースは、既定でユーザー フォルダーに保存されます。 他のワークスペース オブジェクトと同様に、外側のフォルダーからアクセス許可を継承します。 ワークスペース フォルダー構造を使用して、他のユーザーと共有できます。 「ワークスペース オブジェクトをフォルダーに整理する」を参照してください。
また、特定のアクセス許可レベル (管理可能、編集可能、実行可能、表示可能) を使って、共有する特定のユーザーまたはグループを指定することもできます。
特定のユーザーやグループと共有するには、次のようにします。
- [共有] をクリックします。
- スペースを共有するユーザーまたはグループを入力します。 それから、[追加] をクリックして、適切なアクセス許可レベルを設定します。
- [共有] ダイアログの下部にある [リンクのコピー] ボタンを使って、Genie スペースへの共有可能なリンクを取得します。 特権ユーザーは、リンクをクリックして新しいタブで Genie スペースを開き、質問することができます。
スペースの準備に関するベスト プラクティス
- 構築する前に、スペース ユーザーが回答できるように明確に定義された質問のセットを確立します。
- Genie スペースをテストして、応答の品質を確認します。 モデルが期待される応答を提供するかどうかを確認するために、以下を試してください。
- 用意された質問を言い換えます。
- データセットに関連するその他の質問をします。
- 質問で期待される回答が得られるまで、Genie スペースの指示を追加して改良します。
問題のトラブルシューティングに関するベスト プラクティスとヘルプについて詳しくは、「効果的な Genie スペースをキュレーションする」をご覧ください