Funzione ai_similarity
Si applica a: Databricks SQL Databricks Runtime
Importante
Questa funzionalità è disponibile in anteprima pubblica.
Nell'anteprima:
- Il modello linguistico sottostante può gestire diverse lingue, ma queste funzioni sono state ottimizzate per l'inglese.
- Esiste una limitazione della velocità per le API del modello di base sottostanti. Vedere Limiti delle API del modello di base per aggiornare questi limiti.
La funzione ai_similarity()
richiama un modello di intelligenza artificiale generativa all'avanguardia dalle API del modello di base di Databricks per confrontare due stringhe e calcola il punteggio di somiglianza semantica usando SQL.
Requisiti
Importante
I modelli sottostanti che potrebbero essere usati in questo momento sono concessi in licenza con la licenza apache 2.0, copyright © Apache Software Foundation o LLAMA 3.1 Community License © Meta Platforms, Inc. Tutti i diritti riservati. I clienti sono tenuti a garantire la conformità con i modelli di licenza applicabili.
Databricks consiglia di esaminare queste licenze per garantire la conformità con le condizioni applicabili. Se i modelli emergono in futuro che offrono prestazioni migliori in base ai benchmark interni di Databricks, Databricks potrebbe modificare il modello (e l'elenco delle licenze applicabili fornite in questa pagina).
Attualmente, GTE Large (inglese) è il modello sottostante che supporta questa funzione di intelligenza artificiale.
- Questa funzione è disponibile solo nelle aree di lavoro in Funzioni di IA che utilizzano le aree supportate dalle API del modello di base.
- Questa funzione non è disponibile in Azure Databricks SQL classico.
- Controllare la pagina dei prezzi di Databricks SQL.
Nota
In Databricks Runtime 15.1 e versioni successive questa funzione è supportata nei notebook di Databricks, inclusi i notebook eseguiti come attività in un flusso di lavoro di Databricks.
Sintassi
ai_similarity(expr1, expr2)
Argomenti
expr1
: un’espressioneSTRING
.expr2
: un’espressioneSTRING
.
Valori restituiti
Valore FLOAT
che rappresenta la somiglianza semantica tra le due stringhe di input. Il punteggio di output è relativo e deve essere usato solo per la classificazione. Il punteggio 1 indica che i due testi sono uguali.
Esempi
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 1
Databricks Inc.