Funkcja ai_similarity
Dotyczy: Databricks SQL Databricks Runtime
Ważne
Ta funkcja jest dostępna w publicznej wersji zapoznawczej.
W wersji zapoznawczej:
- Podstawowy model językowy może obsługiwać kilka języków, jednak te funkcje są dostrojone w języku angielskim.
- Istnieje ograniczenie szybkości dla podstawowych interfejsów API modelu podstawowego. Zobacz Limity interfejsów API modelu foundation, aby zaktualizować te limity.
Funkcja ai_similarity()
wywołuje najnowocześniejsze model generowania sztucznej inteligencji z interfejsów API modelu usługi Databricks Foundation, aby porównać dwa ciągi i oblicza wskaźnik podobieństwa semantycznego przy użyciu języka SQL.
Wymagania
Ważne
Podstawowe modele, które mogą być używane w tej chwili, są licencjonowane na licencji MIT lub Llama 2 community license. Usługa Databricks zaleca przejrzenie tych licencji w celu zapewnienia zgodności z dowolnymi odpowiednimi warunkami. Jeśli modele pojawią się w przyszłości, które działają lepiej zgodnie z wewnętrznymi testami porównawczymi usługi Databricks, usługa Databricks może zmienić model (oraz listę odpowiednich licencji dostępnych na tej stronie).
Obecnie bge-large-en-v1.5 jest podstawowym modelem obsługującym tę funkcję sztucznej inteligencji.
- Ta funkcja jest dostępna tylko w obszarach roboczych w usłudze AI Functions przy użyciu obsługiwanych regionów interfejsów API modelu foundation.
- Ta funkcja nie jest dostępna w usłudze Azure Databricks SQL Classic.
- Sprawdź stronę cennika usługi Databricks SQL.
Uwaga
W środowisku Databricks Runtime 15.1 lub nowszym ta funkcja jest obsługiwana w notesach usługi Databricks, w tym notesach uruchamianych jako zadanie w przepływie pracy usługi Databricks.
Składnia
ai_similarity(expr1, expr2)
Argumenty
expr1
STRING
: wyrażenie.expr2
STRING
: wyrażenie.
Zwraca
Wartość FLOAT
reprezentująca semantyczną podobieństwo między dwoma ciągami wejściowymi. Wynik danych wyjściowych jest względny i powinien być używany tylko do klasyfikowania. Wynik 1 oznacza, że dwa tekst są równe.
Przykłady
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 1
Databricks Inc.