Práce s prostorem AI/BI Genie
Důležité
Tato funkce je ve verzi Public Preview. Viz Povolení prostorů Genie ve vašem pracovním prostoru.
Přehled
Odborníci na domény, jako jsou datoví analytici, konfigurují prostory Genie s datovými sadami, ukázkovými dotazy a textovými pokyny, které Genie pomáhají překládat obchodní otázky do analytických dotazů. Po nastavení můžou firemní uživatelé klást otázky a generovat vizualizace, aby porozuměli provozním datům. Sémantické znalosti Genie můžete průběžně aktualizovat, protože vaše data se mění a uživatelé představují nové otázky. Další informace o DatabricksIQ najdete v tématu Funkce založené na DatabricksIQ.
AI/BI Genie vybere relevantní názvy a popisy z anotovaných tabulek a sloupců a převede otázky v přirozeném jazyce na ekvivalentní dotaz SQL. Pokud je to možné, odpoví vygenerovaným dotazem a tabulkou výsledků. Pokud Genie nemůže vygenerovat odpověď, může se zeptat na následné otázky, které objasní, když se pokusí poskytnout odpověď.
Příklady případů použití
Můžete vytvořit různé prostory Genie, které budou sloužit různým jiným než technickým cílovým skupinám. Následující scénáře popisují dva možné případy použití.
Příklad 1: Vizualizace stavu příležitosti
Manažer prodeje chce získat aktuální stav otevřených a uzavřených příležitostí podle fáze v prodejním kanálu. Můžou pracovat s prostorem Genie pomocí přirozeného jazyka a automaticky vygenerovat vizualizaci.
Následující obrázek gif znázorňuje tuto interakci:
Příklad 2: Sledování logistiky
Logistická společnost chce používat Prostory Genie k tomu, aby firemním uživatelům z různých oddělení pomohla sledovat provozní a finanční podrobnosti. Nastavili prostor Genie pro své manažery přepravních zařízení, aby mohli sledovat zásilky a další pro finanční manažery, aby porozuměli svému finančnímu zdraví.
Technické požadavky a limity
Při používání prostorů Genie platí následující požadavky a limity:
- Katalog Unity: Data pro prostor Genie musí být zaregistrovaná v katalogu Unity.
- Výpočty: Musíte použít pro nebo bezserverový SQL Warehouse.
- Kapacita pracovního prostoru: Každý pracovní prostor může mít až 1 000 prostorů Genie.
Požadována oprávnění
K vytváření, úpravám a používání prostorů Genie se vyžadují následující oprávnění:
- Výpočetní oprávnění: Tvůrci, editory a uživatelé Genie vyžadují přístup CAN USE k výchozímu SQL Warehouse určenému pro prostor. Tvůrci při vytváření prostoru vyberou výchozí SQL Warehouse. Můžou vybrat libovolný SQL Warehouse, pro který mají oprávnění SPUSTIT.
- Přístupová oprávnění k datům: Každý uživatel, který pracuje s prostorem, potřebuje alespoň
SELECT
oprávnění k datům používaným v prostoru. - Oprávnění k prostoru Genie: Uživatelé potřebují oprávnění SPUSTIT v prostoru Genie, aby mohli pracovat s Genie a daty použitými v prostoru. Kompletní mapování oprávnění a schopností pro prostor Genie najdete v seznamech řízení přístupu k prostoru Genie.
Poznámka:
Konfigurace přístupu k datům a výpočetním prostředkům vyžaduje obecně zvýšená oprávnění omezená na správce. Viz Vytvoření služby SQL Warehouse a správa oprávnění v katalogu Unity.
Povolení prostorů Genie v pracovním prostoru
Poznámka:
Abyste mohli tuto funkci povolit, musíte mít zvýšená oprávnění.
Genie používá funkce AI využívající Azure AI, které musí být povolené na úrovni účtu a v pracovním prostoru, ve kterém se vytvářejí prostory Genie. Pokud chcete povolit prostory Genie, ověřte každé z následujících nastavení.
- Funkce založené na službách Azure AI musí být povolené na úrovni účtu. Správce účtu může tuto funkci povolit pomocí následujících kroků:
Funkce služeb Azure AI musí být povolené na úrovni účtu, aby bylo možné je povolit na úrovni pracovního prostoru.
Pro pracovní prostor musí být povolené funkce využívající služby Azure AI. Správce pracovního prostoru může tuto funkci povolit pomocí následujících kroků:
- Přihlaste se ke svému pracovnímu prostoru.
- Klikněte na své uživatelské jméno v horním panelu pracovního prostoru Azure Databricks a vyberte Nastavení.
- Klikněte na kartu Upřesnit a posuňte se dolů do části Další .
- Zapněte možnost funkcí využívajících azure AI.
Genie musí být povolená ze stránky Náhledy pracovního prostoru. Správce pracovního prostoru může tuto verzi Preview povolit. Viz Správa azure Databricks Preview.
Vytvoření nového prostoru Genie
Když jsou prostory Genie povolené v datových analytikech pracovního prostoru, můžou vytvořit prostředí prostoru Genie specifické pro doménu pro firemní uživatele pomocí následujících kroků:
Klikněte na Genie na bočním panelu.
Klikněte na Nový v pravém horním rohu obrazovky.
V dialogovém okně Nový zvolte počáteční nastavení. Možnosti jsou popsány takto:
- Název: Název se zobrazí v prohlížeči pracovního prostoru s jinými objekty pracovního prostoru. Zvolte název, který koncovým uživatelům pomůže zjistit prostor Genie.
- Popis: Uživatelé uvidí popis, když otevřou prostor Genie. Tato textová oblast slouží k popisu účelu mezer.
- Výchozí sklad: Tento výpočetní prostředek využívá příkazy SQL generované v prostorech Genie. Koncoví uživatelé potřebují přístup k tomuto skladu, aby mohli pracovat s prostorem. Prostor Genie může používat pro nebo bezserverový SQL Warehouse. Pro zajištění optimálního výkonu doporučuje Databricks používat bezserverový SQL Warehouse.
- Tabulky: Prostory Genie můžou být založené na jedné nebo více tabulkách. Tlačítko Přidat tabulky otevře nové dialogové okno, ve kterém můžete vybrat tabulky katalogu Unity, které chcete zahrnout.
- Ukázkové otázky: Ukázkové otázky jsou volitelné. Zobrazují se v chatech a poskytují příklady typů otázek, které můžou uživatelé klást. Dají se přidat během vytváření nebo později z nastavení prostoru.
Jaká data mám použít?
Nové prostory Genie můžete vytvořit na základě jedné nebo více spravovaných tabulek Katalogu Unity. AI/BI Genie používá metadata připojená k objektům katalogu Unity k vygenerování odpovědí. Dobře anotované datové sady spárované s konkrétními pokyny, které poskytnete, jsou klíčem k vytvoření pozitivního prostředí pro koncové uživatele.
Databricks doporučuje následující:
- Kurátorovaná data pro analytickou spotřebu: Zobrazení vrstev pro snížení počtu sloupců a přidání informací specifických pro použití pro zvýšení kvality odpovědi.
- Minimalizujte počet tabulek a sloupců v prostoru Genie: Přidejte pouze tabulky a sloupce potřebné k zodpovězení otázek pro danou doménu. Nepotřebné tabulky nebo sloupce můžou způsobit, že Genie poskytne matoucí nebo nesprávné odpovědi nebo zobrazí chybovou zprávu.
Uveďte pokyny
Pokyny pomáhají řídit odpovědi Genie tak, aby mohl zpracovat jedinečný žargon, logiku a koncepty v dané doméně. Komplexní pokyny jsou důležité pro bezproblémové a intuitivní prostředí prostoru Genie. Pokud chcete zadat pokyny, kliknutím na Příkazy na bočním panelu Genie otevřete podokno s pokyny. V tomto podokně můžete přidat obecné pokyny, ukázkové dotazy SQL a funkce SQL.
Obecné pokyny
Poskytněte pokyny ve formátu prostého textu, které jasně vyjadřují předvolby vaší firmy nebo odpovědi, aby mohla Genie postupovat. Pokyny můžete naformátovat jako jednu komplexní poznámku nebo je kategorizovat podle témat pro lepší organizaci.
Následující příklad ukazuje příklad informací, které můžete zahrnout do obecných pokynů:
- Informace o zaměstnání specifické pro společnost:
- "Náš fiskální rok začíná v únoru"
- Hodnoty, aliasy nebo běžné filtry:
- "Vždy převést na malá písmena a použít operátor like při použití filtrů."
- "Používejte zkratky pro stavy v hodnotách filtru."
- Zadejte funkce pro odpovědi na otázky a zadejte pokyny pro návratové hodnoty:
- "Pro čtvrtletí použijte funkci definovanou uživatelem
adventureworks.oneb.get_quarter(date)
. Výstupemget_quarter()
je čtvrtletí a buď 1,2,3, nebo 4. Použijte to k filtrování dat podle potřeby.
- "Pro čtvrtletí použijte funkci definovanou uživatelem
Příklady dotazů SQL
Příklady dotazů SQL jsou dotazy SQL, které připravíte na tréning Genie. Při odpovídání na otázky Genie inteligentně vybere relevantní dotazy, které vám pomůžou vygenerovat odpověď. Když přidáváte ukázkové dotazy, efektivně ukazujete Genie, jak používat vaše data k zodpovězení otázek. Můžete také přidat ukázkové otázky k učení Genie o typech otázek, na které byste očekávali, že ukázkový dotaz odpoví. Pokud Genie obdrží odpovídající otázku, může k zadání odpovědi použít ukázkový dotaz přímo. Pokud se zobrazí podobná otázka, může pomocí vodítek z ukázkového dotazu pomoct strukturovat SQL poskytnuté v odpovědi. Zaměřte se na poskytování ukázek, které zvýrazňují logiku jedinečnou pro vaši organizaci a data, jako v následujícím příkladu:
-- Return our current total open pipeline by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = 'Pipeline' AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
Přidání parametrů v dotazech SQL
Parametry umožňují psát ukázkové dotazy, které obsahují zástupné symboly pro konkrétní hodnoty, které se mají nahradit za běhu. S parametry může Genie přijímat konkrétní vstupy z uživatelských otázek a opakovaně používat strukturu ukázkového dotazu, aby poskytovala ověřené odpovědi jako důvěryhodné prostředky. Můžete například upravit předchozí dotaz SQL tak, aby zahrnoval parametr, který filtruje hodnotu o.forecastcategory
, a umožnit dotazu řešit dotazy týkající se příležitostí označených v různých kategoriích prognóz. Další informace o použití parametrizovaných dotazů k vygenerování repons označených jako důvěryhodné prostředky najdete v tématu Použití důvěryhodných prostředků v prostorech AI/BI Genie.
Následující fragment kódu ukazuje předchozí příklad upravený přidáním parametru o.forecastcategory
pro hodnotu. Parametry používají stejnou syntaxi jako značky pojmenovaných parametrů. Viz značky pojmenovaných parametrů.
-- Return our current pipeline at a stage by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = :forecast_category AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
Přidání parametru do dotazu:
Umístěte kurzor na místo, kam chcete do dotazu umístit parametr.
Kliknutím na Přidat parametr vložíte nový parametr.
Tím se vytvoří nový parametr s výchozím názvem
parameter
. Pokud chcete změnit výchozí název, nahraďte ho v editoru dotazů. Parametry můžete také přidat zadáním dvojtečky následované názvem parametru (:parameter_name
) do editoru.
Úprava parametru dotazu
Pokud chcete upravit parametr, postupujte takto:
Klikněte vedle názvu parametru. Zobrazí se dialogové okno s podrobnostmi o parametrech a obsahuje následující možnosti konfigurace:
Klíčové slovo: Klíčové slovo, které představuje parametr v dotazu. To lze změnit pouze přímo aktualizací textu v dotazu.
Zobrazované jméno: Jméno čitelné člověkem, které Genie používá v chatovacím prostředí. Když Genie použije parametrizovaný dotaz k vygenerování odpovědi, zahrne do odpovědi zobrazovaný název a přidruženou hodnotu.
Typ: Mezi podporované typy patří Řetězec, Datum, Datum a Čas a Číselné.
- Výchozí typ je String.
- Číselný datový typ umožňuje zadat mezi desetinným a celočíselným číslem. Výchozí číselný typ je Desetinné číslo.
Poznámka:
Pokud skutečná vstupní hodnota neodpovídá vybranému typu parametru, Genie zachází se vstupní hodnotou jako s nesprávným typem, což může vést k nepřesným výsledkům.
Kliknutím na jinou část uživatelského rozhraní dialogové okno zavřete.
Funkce SQL
Funkce SQL jsou vlastní funkce, které jsou uložené v katalogu Unity a používají ho Genie k zodpovězení konkrétních otázek. Genie může tyto funkce volat a vložit libovolné uživatelem zadané parametry, ale nemůže získat přístup k podkladovému obsahu SQL. To znamená, že funkce SQL jsou ideální pro odpovědi na běžné konkrétní otázky, které obsahují složité argumenty nebo výpočty, ke kterým by Genie neměla mít přístup nebo je upravovat. Pokyny k registraci funkce v katalogu Unity najdete v tématu Vytvoření funkce tabulky SQL a uživatelem definovaných funkcí (UDF) v katalogu Unity.
Důvěryhodné prostředky
Když se k vygenerování odpovědi použije přesný text parametrizovaného ukázkového dotazu nebo funkce SQL, Označí Genie odpověď jako důvěryhodný prostředek. Důvěryhodné prostředky jsou určeny k předání další vrstvy záruky v přesnosti výsledku uživateli prostoru. Viz Použití důvěryhodných prostředků v prostorech AI/BI Genie.
Chat v prostoru Genie
Většina interakcí s prostorem Genie probíhá v okně chatu.
Nové okno chatu obsahuje kurátorovaný soubor ukázkových otázek. Tyto ukázkové otázky pomáhají uživatelům pochopit, jaké otázky mohou pokládat prostor Genie. Textové pole, kde uživatelé zadávají otázky, se nachází v dolní části obrazovky.
Odpovědi se zobrazí nad textovým polem. Když uživatel zadá otázku, uloží se do vlákna historie chatu v levém podokně.
Historie chatu
Vlákna historie chatu se ukládají pro každého uživatele, aby mohli odkazovat na minulé otázky a odpovědi. Uživatelé můžou také znovu odeslat nebo revidovat otázky z vlákna chatu. Tlačítko Nový chat v levém podokně spustí nové vlákno.
Každé vlákno chatu udržuje kontext předchozích otázek, které byly položeny. To uživatelům umožňuje klást následné otázky k dalšímu zkoumání nebo refocusování sady výsledků.
Struktura odpovědi
Přesná struktura odpovědí se liší v závislosti na otázce. Odpovědi často obsahují vysvětlení přirozeného jazyka a tabulku zobrazující příslušnou sadu výsledků. Všechny odpovědi zahrnují dotaz SQL, který byl vygenerován pro odpověď na otázku. Kliknutím na Zobrazit vygenerovaný kód zobrazíte vygenerovaný dotaz.
Pravá dolní strana odpovědi obsahuje volitelné akce. Soubor CSV odpovědi můžete zkopírovat do schránky, stáhnout ho jako soubor CSV, přidat ho jako pokyn k prostoru Genie a přejít na odpověď nebo ji přejít dolů.
Sada dlaždic Rychlých akcí sleduje odpovědi, které obsahují tabulková data. Můžete je použít ke generování vizualizací.
Vizualizaci můžete také vygenerovat tak, že ji po získání výsledku dotazu popíšete slovy.
Poskytnutí zpětné vazby k odpovědím
Každá odpověď AI/BI Genie obsahuje tlačítko zpětné vazby o palec nahoru nebo palec dolů. Databricks doporučuje uživatelům, aby pomocí tohoto mechanismu poskytli zpětnou vazbu k prostoru.
V případě odpovědi, která obsahuje výsledky dotazu, mohou uživatelé požádat, aby ji zkontroloval editor prostoru Genie kliknutím na tlačítko . Pokud má uživatel dotazy týkající se kvality nebo přesnosti vygenerované odpovědi, může ji označit ke kontrole a volitelně přidat komentář nebo otázku.
Podnikoví uživatelé můžou zobrazit aktualizace otázek, které si označili ke kontrole, na stránce Historie . Uživatelé s alespoň OPRÁVNĚNÍM MOHOU SPRAVOVAT v prostoru Genie můžou zkontrolovat konkrétní výměnu, okomentovat žádost a potvrdit nebo opravit odpověď. Můžou získat přístup ke zpětné vazbě a kontrolovat žádosti na stránce monitorování. Tuto zpětnou vazbu pak můžete použít k ladění odpovědí a iteraci v prostoru. Přečtěte si historii a zpětnou vazbu.
Kontrola historie a zpětné vazby
Prostor Genie je určený jako nástroj pro průběžnou spolupráci pro datové týmy a firemní uživatele, který shromažďuje znalosti, nikoli jednorázové nasazení. Pochopení nových otázek, na které potřebují firemní uživatelé odpovědi, je nezbytné pro vytváření znalostí. Na stránce historie můžete zobrazit jednotlivé otázky a odpovědi, zpětnou vazbu o palec nahoru nebo palec dolů, kterou poskytli uživatelé, a otázky označené ke kontrole. Chcete-li otevřít stránku historie, klikněte na položku Historie na bočním panelu prostoru Genie.
Na stránce historie se zobrazují všechny otázky a odpovědi, které byly v prostoru položeny. Dotazy můžete filtrovat podle času, hodnocení, uživatele nebo stavu. Díky monitorování prostoru můžou editory prostorů Genie proaktivně porozumět dotazům vyvolaým podnikovými uživateli a tomu, jak prostor Genie reagoval.
Když identifikujete otázky, se kterými Genie bojuje, můžete aktualizovat prostor Genie konkrétními pokyny, aby se zlepšily odpovědi. Kliknutím na otázku otevřete text otázky a odpovědi. Z tohoto zobrazení můžete také získat přístup k úplnému vláknu chatu.
Úprava vygenerovaného SQL
Vygenerovaný SQL můžete zkontrolovat a upravit v libovolné odpovědi. Autoři prostoru Genie obvykle znají doménu a data, která jim umožňují rozpoznat, kdy Genie generuje nesprávnou odpověď. Chyby je často možné opravit malým množstvím ručního ladění vygenerovanému dotazu SQL. Pokud chcete zobrazit vygenerovaný SQL pro libovolnou odpověď, klikněte na Zobrazit vygenerovaný kód a prozkoumejte dotaz.
Vygenerovaný příkaz SQL můžete upravit, abyste ho opravili, pokud máte oprávnění K ÚPRAVám nebo vyšším oprávněním v prostoru Genie. Po provedení oprav spusťte dotaz. Pak ji můžete uložit jako pokyn naučit Genie, jak odpovědět v budoucnu. Chcete-li uložit upravený dotaz, klikněte na uložit jako instrukce.
Vyhodnocení odpovědí pomocí srovnávacích testů
Srovnávací testy umožňují vertikálně navýšit kapacitu testování a hodnocení jednotlivých odpovědí v prostoru Genie. Na rozdíl od pokynů mají být srovnávací testy vyhodnoceny, ne informovat, váš prostor Genie. Genie k vylepšení kontextu Genie nepoužívá srovnávací dotazy ani příklad SQL.
Pomocí srovnávacích testů můžete spustit kolekci testovacích otázek a použít odpovědi k měření přesnosti Genie. Volitelně můžete zahrnout příkaz SQL, který vrátí očekávané výsledky. Když se spustí otázka srovnávacího testu, porovná se odpověď Genie s výsledky poskytnutými příkazem SQL a skóre přesnosti. Pokud nebyla zadána žádná odpověď SQL, je otázka označena ke kontrole.
Viz Použití srovnávacích testů v prostoru Genie.
Sdílení prostoru Genie
Důležité
Uživatelé prostoru Genie musí pro přístup k datům používat své vlastní přihlašovací údaje. Jakákoli otázka týkající se dat, ke kterým nemají přístup, vygeneruje prázdnou odpověď.
Uživatelé prostoru Genie musí mít oprávnění CAN USE pro sklad připojený k prostoru Genie a přístupová oprávnění k objektům katalogu Unity, které se v prostoru vystavily. Podívejte se , jaká data mám použít?.
Nové prostory Genie se ve výchozím nastavení ukládají do složky uživatele. Podobně jako ostatní objekty pracovního prostoru dědí oprávnění z nadřazené složky. Strukturu složek pracovního prostoru můžete použít ke sdílení s ostatními uživateli. Viz Uspořádání objektů pracovního prostoru do složek.
Můžete také určit určité uživatele nebo skupiny, se kterými se mají sdílet na dané úrovni oprávnění: MŮŽE SPRAVOVAT, MŮŽE UPRAVOVAT, MŮŽE SPUSTIT a MŮŽE ZOBRAZIT.
Sdílení s konkrétními uživateli nebo skupinami:
- Klikněte na Share (Sdílet).
- Zadejte uživatele nebo skupiny, se kterými chcete prostor sdílet. Potom klikněte na Přidat a nastavte příslušné úrovně oprávnění.
- Pomocí tlačítka Kopírovat odkaz v dolní části dialogového okna Sdílet získáte sdíletelný odkaz na prostor Genie. Privilegovaní uživatelé můžou kliknout na odkaz a otevřít prostor Genie na nové kartě a klást otázky.
Klonování prostoru Genie
Klonování prostoru Genie vytvoří kopii, včetně veškerého kontextu nastavení a pokynů. To je užitečné, pokud máte dobře vyvinutý prostor a chcete vytvořit nový prostor pro další testování nebo znovu použít kontext z původního prostoru. Po naklonování mezery je nový prostor nezávislý na původním prostoru a umožňuje provádět úpravy a úpravy, aniž by to mělo vliv na původní.
Následující prvky se zkopírují do klonovaného prostoru Genie:
- Tabulky a nastavení
- Obecné pokyny
- Příklady dotazů SQL
- Funkce SQL
Existující vlákna chatu a data historie se do nového prostoru nekopírují.
Pokud chcete klonovat prostor Genie, postupujte takto:
- Otevřete prostor Genie, který chcete klonovat.
- V pravém horním rohu prostoru klikněte na nabídku kebabu.
- Klikněte na Klonovat.
- (Volitelné) V dialogovém okně Klonovat zadejte nový název a umístění složky pracovního prostoru pro klonovaný prostor Genie.
- Kliknutím na Clone (Klonovat ) vytvořte nové místo.
Ochrana osobních údajů a zabezpečení
Otázka: Jaký model Genie používá?
Genie používá model Azure OpenAI.
Otázka: Jaká data se do modelu odesílají?
Genie spaces generují odpovědi na otázky v přirozeném jazyce pomocí metadat a pokynů. Genie nemá přístup k datům na úrovni řádků.
Ke zpracování odpovědí používá Genie následující:
- Výzva k přirozenému jazyku odeslaná uživatelem
- Názvy a popisy tabulek
- Názvy a popisy sloupců
- Obecné pokyny
- Příklady dotazů SQL
- Funkce SQL
Otázka: Shromažďuje Azure OpenAI moje data?
Ne. Společnost Databricks se přihlásila k výjimce z programu pro monitorování zneužití a kontroly lidí, pod kterým Microsoft neukládá žádné výzvy a dokončení odesílané do služby Azure OpenAI. Další informace najdete v dokumentaci Microsoftu.
Osvědčené postupy pro přípravu prostoru
- Než začnete vytvářet, vytvořte sadu dobře definovaných otázek, na které chcete, aby uživatelé prostoru mohli odpovídat.
- Otestujte prostor Genie a zkontrolujte kvalitu odezvy. Zkuste následující postup, abyste zjistili, jestli model poskytuje očekávanou odpověď:
- Přehrávejte poskytnuté otázky.
- Položte další otázky související s datovými sadami.
- Přidejte a upřesněte pokyny k prostoru Genie, dokud nebudou otázky poskytovat očekávanou odpověď.
Další pokyny k osvědčeným postupům a nápovědě k řešení problémů najdete v tématu Kurátorování efektivního prostoru Genie.