ai_extract函式

適用於: 檢查標示為是 Databricks SQL 檢查標示為是 Databricks Runtime

重要

這項功能處於公開預覽狀態

預覽中:

  • 基礎語言模型可以處理數種語言,不過這些函式會針對英文進行調整。
  • 基礎基礎模型 API 有速率限制。 請參閱 基礎模型 API 限制 以更新這些限制。

ai_extract() 式可讓您叫用最先進的產生 AI 模型,以使用 SQL 從指定文字擷取標籤所指定的實體。 此函式會使用 Databricks Foundation Model API 所提供的端點的聊天模型。

需求

重要

目前可能使用的基礎模型會根據 Apache 2.0 授權或 Llama 2 社群授權來授權。 Databricks 建議檢閱這些授權,以確保符合任何適用的條款。 如果模型在未來根據 Databricks 的內部基準檢驗而表現更好,Databricks 可能會變更模型(以及此頁面提供的適用授權清單)。

目前, Mixtral-8x7B 指示 是支持這些 AI 函式的基礎模型。

注意

在 Databricks Runtime 15.1 和更新版本中,Databricks 筆記本支援此函式,包括以 Databricks 工作流程中工作身分執行的筆記本。

語法

ai_extract(content, labels)

引數

  • contentSTRING:表達式。
  • labels:常 ARRAY<STRING> 值。 每個元素都是要擷取的實體類型。

傳回

STRUCT 其中每個欄位對應至 中指定的 labels實體類型。 每個欄位都包含代表擷取實體的字串。 如果找到任何實體類型的多個候選專案,則只會傳回一個。

如果 contentNULL,則結果為 NULL

範例

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}