Funzione ai_extract

Si applica a: segno di spunta sì Databricks SQL segno di spunta sì Databricks Runtime

Importante

Questa funzionalità è disponibile in anteprima pubblica.

Nell'anteprima:

  • Il modello linguistico sottostante può gestire diverse lingue, ma queste funzioni sono state ottimizzate per l'inglese.
  • Esiste una limitazione della velocità per le API del modello di base sottostanti. Vedere Limiti delle API del modello di base per aggiornare questi limiti.

La funzione ai_extract() consente di utilizzare un modello di IA generativa all'avanguardia per estrarre le entità specificate dalle etichette da un determinato testo utilizzando SQL. Questa funzione usa un modello di chat che gestisce l'endpoint reso disponibile dalle API del modello di base di Databricks.

Requisiti

Importante

I modelli sottostanti che potrebbero essere usati in questo momento sono concessi in licenza con la licenza apache 2.0, copyright © Apache Software Foundation o LLAMA 3.1 Community License © Meta Platforms, Inc. Tutti i diritti riservati. I clienti sono tenuti a garantire la conformità con i modelli di licenza applicabili.

Databricks consiglia di esaminare queste licenze per garantire la conformità con le condizioni applicabili. Se i modelli emergono in futuro che offrono prestazioni migliori in base ai benchmark interni di Databricks, Databricks potrebbe modificare il modello (e l'elenco delle licenze applicabili fornite in questa pagina).

Attualmente, Meta-Llama-3.1-70B-Instruct è il modello sottostante che alimenta queste funzioni di intelligenza artificiale.

Nota

In Databricks Runtime 15.1 e versioni successive questa funzione è supportata nei notebook di Databricks, inclusi i notebook eseguiti come attività in un flusso di lavoro di Databricks.

Sintassi

ai_extract(content, labels)

Argomenti

  • content: un’espressione STRING.
  • labels: un valore letterale ARRAY<STRING>. Ogni elemento è un tipo di entità da estrarre.

Valori restituiti

Oggetto STRUCT in cui ogni campo corrisponde a un tipo di entità specificato in labels. Ogni campo contiene una stringa che rappresenta l'entità estratta. Se vengono trovati più candidati per qualsiasi tipo di entità, ne viene restituito solo uno.

Se content è NULL, il risultato è NULL.

Esempi

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}