Tworzenie usługa wyszukiwania sztucznej inteligencji platformy Azure w portalu

Azure AI Search to platforma pobierania informacji dla przedsiębiorstwa. Obsługuje tradycyjne wyszukiwanie i wyszukiwanie oparte na konwersacyjnej sztucznej inteligencji na potrzeby środowisk "czatu z danymi" w odniesieniu do zastrzeżonej zawartości.

Najprostszym sposobem utworzenia usługi jest użycie witryny Azure Portal, która jest opisana w tym artykule.

Możesz również użyć programu Azure PowerShell, interfejsu wiersza polecenia platformy Azure, interfejsu API REST zarządzania, szablonu usługi Azure Resource Manager, pliku Bicep lub narzędzia Terraform.

Animowany obraz GIF

Przed rozpoczęciem

Kilka właściwości usługi jest naprawionych przez okres istnienia usługi. Przed utworzeniem usługi zdecyduj się na nazwę, region i warstwę.

  • Nazwa usługi staje się częścią punktu końcowego adresu URL. Nazwa musi być unikatowa i musi być zgodna z regułami nazewnictwa.

  • Region określa miejsce przechowywania danych i dostępność niektórych funkcji. Semantyczne klasyfikator i integracja sztucznej inteligencji platformy Azure są dostarczane z wymaganiami dotyczącymi regionów. Upewnij się, że wybrany region obsługuje potrzebne funkcje.

  • Warstwa usługi określa infrastrukturę, limity usług i rozliczenia. Niektóre funkcje nie są dostępne w niższych lub wyspecjalizowanych warstwach.

Subskrypcja (bezpłatna lub płatna)

Płatne (lub rozliczane) wyszukiwanie odbywa się po wybraniu warstwy rozliczanej (Podstawowa lub nowsza) podczas tworzenia zasobu w płatnej subskrypcji platformy Azure.

Aby bezpłatnie wypróbować usługę Azure AI Search, otwórz subskrypcję wersji próbnej, a następnie utwórz usługę wyszukiwania, wybierając warstwę Bezpłatna. Możesz mieć jedną bezpłatną usługę wyszukiwania na subskrypcję platformy Azure. Bezpłatne usługi wyszukiwania są przeznaczone do krótkoterminowej oceny produktu dla aplikacji nieprodukcyjnych. Ogólnie rzecz biorąc, można ukończyć wszystkie przewodniki Szybki start i większość samouczków, z wyjątkiem osób z semantyczną rangą (wymaga rozliczanej usługi).

Alternatywnie możesz użyć bezpłatnych środków, aby wypróbować płatne usługi platformy Azure. Dzięki temu podejściu możesz utworzyć usługę wyszukiwania w warstwie Podstawowa lub nowsza, aby uzyskać więcej pojemności. Karta kredytowa nie zostanie obciążona, chyba że jawnie zmienisz ustawienia i poprosisz o jej obciążenie. Innym podejściem jest aktywowanie środków na korzystanie z platformy Azure w ramach subskrypcji programu Visual Studio. Subskrypcja programu Visual Studio zapewnia środki co miesiąc, których można używać dla płatnych usług platformy Azure.

Znajdowanie oferty usługi Azure AI Search

  1. Zaloguj się w witrynie Azure Portal.

  2. Wybierz pozycję (Utwórz zasób") w lewym górnym rogu.

  3. Użyj paska wyszukiwania, aby znaleźć frazę "Azure AI Search*.

Zrzut ekranu przedstawiający stronę Tworzenie zasobu w portalu.

Wybierz subskrypcję

Jeśli masz więcej niż jedną subskrypcję, wybierz jedną z nich dla usługi wyszukiwania. Jeśli wdrażasz szyfrowanie zarządzane przez klienta lub używasz innych funkcji, które zależą od tożsamości usługi zarządzanej na potrzeby dostępu do danych zewnętrznych, wybierz tę samą subskrypcję, która jest używana dla usługi Azure Key Vault lub innych usług, dla których są używane tożsamości zarządzane.

Ustawianie grupy zasobów

Grupa zasobów to kontener, który zawiera powiązane zasoby dla rozwiązania platformy Azure. Jest to przydatne w przypadku konsolidowania zasobów tego samego rozwiązania, monitorowania kosztów i sprawdzania daty utworzenia usługi wyszukiwania.

Zrzut ekranu przedstawiający stronę Tworzenie grupy zasobów w portalu.

W czasie można śledzić bieżące i przewidywane koszty w górę lub wyświetlać opłaty za poszczególne zasoby. Poniższy zrzut ekranu przedstawia rodzaj informacji o kosztach, które można zobaczyć podczas łączenia wielu zasobów w jedną grupę.

Zrzut ekranu przedstawiający stronę Zarządzanie kosztami w portalu.

Napiwek

Grupy zasobów upraszczają czyszczenie, ponieważ usunięcie grupy zasobów powoduje usunięcie wszystkich elementów w niej.

Nazwij usługę

W obszarze Szczegóły wystąpienia podaj nazwę usługi w polu Adres URL . Nazwa jest częścią punktu końcowego, względem którego są wystawiane wywołania interfejsu API: https://your-service-name.search.windows.net. Na przykład jeśli chcesz, aby punkt końcowy znajdował się pod adresem https://myservice.search.windows.net, wpisz myservice.

Wymagania dotyczące nazwy usługi:

  • Unikatowe w przestrzeni nazw search.windows.net
  • Długość od 2 do 60 znaków
  • Składa się z małych liter, cyfr lub kreski (-)
  • Nie używaj kreski w dwóch pierwszych znakach ani jako ostatniego pojedynczego znaku
  • Nie używaj kolejnych kresek w dowolnym miejscu

Napiwek

Jeśli masz wiele usług wyszukiwania, pomaga uwzględnić region (lub lokalizację) w nazwie usługi jako konwencję nazewnictwa. Nazwa, na przykład mysearchservice-westus , umożliwia zapisanie podróży do strony właściwości podczas podejmowania decyzji o sposobie łączenia lub dołączania zasobów.

Wybierz region

Ważne

Ze względu na duże zapotrzebowanie usługa Azure AI Search jest obecnie niedostępna dla nowych wystąpień w niektórych regionach.

Jeśli używasz wielu usług platformy Azure, umieszczenie wszystkich z nich w tym samym regionie minimalizuje lub unieważnia opłaty za przepustowość. Nie są naliczane opłaty za ruch wychodzący danych między usługami w tym samym regionie.

Ogólnie rzecz biorąc, wybierz region w pobliżu, chyba że mają zastosowanie następujące zagadnienia:

  • Najbliższy region jest ograniczony pojemnością. Na przykład Europa Zachodnia jest w stanie i jest niedostępna dla nowych wystąpień. Inne regiony znajdują się w pojemności dla określonych warstw. Jedną z zalet korzystania z witryny Azure Portal do konfigurowania zasobów jest to, że udostępnia ona tylko te regiony i warstwy, które są dostępne.

  • Chcesz użyć zintegrowanego fragmentowania i wektoryzacji danych lub wbudowanych umiejętności na potrzeby wzbogacania sztucznej inteligencji. Konta wielousług usług Azure OpenAI i Azure AI muszą znajdować się w tym samym regionie co usługa Azure AI Search na potrzeby integracji. Wybierz region , który udostępnia wszystkie niezbędne zasoby.

  • Chcesz użyć usługi Azure Storage do indeksowania opartego na indeksatorze lub musisz przechowywać dane aplikacji, które nie są w indeksie. Stan sesji debugowania, pamięci podręczne wzbogacania i magazyny wiedzy to funkcje usługi Azure AI Search, które mają zależność od usługi Azure Storage. Wybrany region dla usługi Azure Storage ma wpływ na bezpieczeństwo sieci. W szczególności, jeśli konfigurujesz zaporę, należy umieścić zasoby w oddzielnych regionach. Aby uzyskać więcej informacji, zobacz Połączenia wychodzące z usługi Azure AI Search do usługi Azure Storage.

Oto lista kontrolna wybierania regionu:

  1. Czy usługa Azure AI Search jest dostępna w pobliskim regionie? Sprawdź listę obsługiwanych regionów.

  2. Czy wiesz, której warstwy chcesz użyć? Warstwy są omówione w następnym kroku. Sprawdź dostępność regionu według warstwy , aby określić, czy możesz utworzyć usługę wyszukiwania w wybranej warstwie w wybranym regionie.

  3. Czy potrzebujesz wzbogacania sztucznej inteligencji lub zintegrowanego fragmentowania i wektoryzacji danych? Sprawdź, czy usługi Azure OpenAI i Azure AI multiservice są oferowane w tym samym regionie co usługa Azure AI Search.

    Należy pamiętać, że interfejs API osadzania wielomodalnego usługi Azure AI Vision używany do zintegrowanej wektoryzacji obrazów musi być dostępny za pośrednictwem konta wielousług usługi Azure AI, ale jest dostępny w mniejszym podzestawie regionów.

  4. Czy masz wymagania dotyczące ciągłości działania i odzyskiwania po awarii (BCDR)? Takie wymagania określają tworzenie wielu usług wyszukiwania w parach regionalnych w strefach dostępności. Jeśli na przykład pracujesz w Ameryka Północna, możesz wybrać wschodnie stany USA i Zachodnie stany USA lub Północno-środkowe stany USA i Południowo-środkowe stany USA dla każdej usługi wyszukiwania.

Wybieranie warstwy

Usługa Azure AI Search jest oferowana w wielu warstwach cenowych: Bezpłatna, Podstawowa, Standardowa lub Zoptymalizowana pod kątem magazynu. Poszczególne warstwy różnią się między sobą pojemnością i limitami. Istnieje również kilka funkcji zależnych od warstwy.

Przejrzyj opisy warstw pod kątem cech obliczeniowych i dostępności funkcji.

Podstawowa i Standardowa to najczęstsze opcje dla obciążeń produkcyjnych, ale wielu klientów zaczyna od usługi Bezpłatna. Wśród warstw rozliczanych kluczowe różnice to rozmiar partycji i szybkość oraz limity liczby obiektów, które można utworzyć.

Zrzut ekranu przedstawiający stronę Wybierz warstwę cenową.

usługa wyszukiwania utworzone po 3 kwietnia 2024 r. mają większe partycje i wyższe limity przydziału wektorów.

Obecnie niektóre regiony są ograniczone warstwowo. Aby uzyskać więcej informacji, zobacz dostępność regionów według warstwy.

Pamiętaj, że nie można zmienić warstwy cenowej po utworzeniu usługi. Jeśli potrzebujesz wyższej lub niższej warstwy, należy ponownie utworzyć usługę.

Tworzenie usługi

Po podaniu niezbędnych danych wejściowych utwórz usługę.

Zrzut ekranu przedstawiający stronę Przeglądanie i tworzenie usługi.

Usługa jest wdrażana w ciągu kilku minut. Postęp można monitorować za pośrednictwem powiadomień platformy Azure. Rozważ przypięcie usługi do pulpitu nawigacyjnego w celu ułatwienia dostępu w przyszłości.

Zrzut ekranu przedstawiający stronę Monitorowanie i przypinanie usługi.

Konfiguruj uwierzytelnianie

Jeśli nie używasz portalu, dostęp programowy do nowej usługi wymaga podania punktu końcowego adresu URL i uwierzytelnionego połączenia. Możesz użyć jednej z tych opcji lub obu tych opcji:

  1. Podczas konfigurowania połączenia programowego potrzebny jest punkt końcowy usługi wyszukiwania. Na stronie Przegląd znajdź i skopiuj punkt końcowy adresu URL po prawej stronie.

    Zrzut ekranu przedstawiający stronę Przegląd usługi z punktem końcowym adresu URL.

  2. Aby ustawić opcje uwierzytelniania, użyj strony Klucze . Większość przewodników Szybki start i samouczków używa kluczy interfejsu API dla uproszczenia, ale jeśli konfigurujesz usługę dla obciążeń produkcyjnych, rozważ użycie ról platformy Azure. Klucze można skopiować z tej strony.

    Zrzut ekranu przedstawiający stronę Klucze z opcjami uwierzytelniania.

Punkt końcowy i klucz nie są potrzebne do zadań opartych na portalu. Portal jest już połączony z zasobem usługi Azure AI Search z uprawnieniami administratora. Aby zapoznać się z przewodnikiem po portalu, zacznij od przewodnika Szybki start: tworzenie indeksu usługi Azure AI Search w portalu.

Skalowanie usługi

Po aprowizowanej usłudze wyszukiwania można ją skalować w celu spełnienia Twoich potrzeb. W warstwie rozliczanej można skalować usługę w dwóch wymiarach: repliki i partycje. W przypadku bezpłatnej usługi skalowanie w górę nie jest dostępne, a konfiguracja repliki i partycji nie jest oferowana.

Partycje umożliwiają usłudze przechowywanie i przeszukiwanie większej liczby dokumentów.

Repliki umożliwiają usłudze obsługę większego obciążenia zapytaniami wyszukiwania.

Dodawanie zasobów wiąże się z dodaniem opłat do rachunku miesięcznego. Kalkulator cen pomaga w określeniu, jaki wpływ na rozliczenia będzie miało dodanie zasobów. Pamiętaj, że możesz też dostosowywać zasoby do obciążenia. Możesz na przykład zwiększyć ilość zasobów na czas początkowego tworzenia pełnego indeksu, a następnie zmniejszyć ją do poziomu dostosowanego do potrzeb indeksowania przyrostowego.

  1. Przejdź do strony usługi wyszukiwania w witrynie Azure Portal.
  2. W okienku nawigacji po lewej wybierz kolejno pozycje Ustawienia>Skalowanie.
  3. Użyj suwaka, aby dodać zasoby wybranego typu.

Zrzut ekranu przedstawiający stronę skalowania.

Kiedy należy dodać drugą usługę

Większość klientów używa tylko jednej usługi aprowizowanej w warstwie wystarczającej do oczekiwanego obciążenia. Jedna usługa może obsługiwać wiele indeksów, z zastrzeżeniem maksymalnych limitów wybranej warstwy, przy czym każdy indeks jest odizolowany od innych. W usłudze Azure AI Search żądania mogą być kierowane tylko do jednego indeksu, minimalizując prawdopodobieństwo przypadkowego lub zamierzonego pobierania danych z innych indeksów w tej samej usłudze.

Chociaż większość klientów używa tylko jednej usługi, nadmiarowość usług może być konieczna, jeśli wymagania operacyjne są następujące:

Uwaga

W usłudze Azure AI Search nie można segregować operacji indeksowania i wykonywania zapytań; w związku z tym nigdy nie utworzysz wielu usług dla segregowanych obciążeń. Zapytania względem indeksu zawsze dotyczą usługi, w której został utworzony (nie można utworzyć indeksu w jednej usłudze, by następnie skopiować go do innej).

Druga usługa nie jest wymagana w celu zapewnienia wysokiej dostępności. Wysoka dostępność zapytań jest osiągana w przypadku używania co najmniej dwóch replik w tej samej usłudze. Aktualizacje repliki są sekwencyjne, co oznacza, że co najmniej jeden działa po wdrożeniu aktualizacji usługi. Aby uzyskać więcej informacji na temat czasu pracy, zobacz Umowy dotyczące poziomu usług.

Dodawanie kolejnych usług do subskrypcji

Usługa Azure AI Search ogranicza liczbę usług wyszukiwania, które można początkowo utworzyć w ramach subskrypcji. W przypadku wyczerpania maksymalnego limitu możesz zażądać większego limitu przydziału.

Aby zażądać limitu przydziału, musisz mieć uprawnienia Właściciel lub Współautor dla subskrypcji. W zależności od pojemności regionu i centrum danych możesz automatycznie zażądać większego limitu przydziału, aby dodać usługi do subskrypcji. Jeśli żądanie nie powiedzie się, należy zmniejszyć liczbę lub zgłosić bilet pomocy technicznej. W przypadku dużego zwiększenia limitu przydziału, takiego jak ponad 30 dodatkowych usług, należy oczekiwać miesięcznego zwrotu.

  1. Zaloguj się w witrynie Azure Portal, wyszukaj frazę "limity przydziału" na pulpicie nawigacyjnym, a następnie wybierz usługę Limity przydziału .

    Zrzut ekranu przedstawiający termin wyszukiwania przydziału i usługę Limity przydziału w wynikach.

  2. Na stronie Przegląd limitu przydziału wybierz pozycję Wyszukaj.

    Zrzut ekranu przedstawiający kafelek wyszukiwania na stronie Przegląd limitu przydziału.

  3. Ustaw filtry, aby można było przejrzeć istniejący limit przydziału dla usług wyszukiwania w bieżącej subskrypcji. Zalecamy filtrowanie według użycia.

  4. Znajdź region i warstwę, która wymaga większego limitu przydziału, a następnie wybierz ikonę ołówka Edytuj , aby rozpocząć żądanie.

    Zrzut ekranu przedstawiający stronę Moje przydziały z regionem z maksymalnym limitem przydziału.

  5. W obszarze Szczegóły limitu przydziału określ lokalizację, warstwę i nowy limit przydziału subskrypcji. Żadna z wartości nie może być pusta. Nowy limit musi być większy niż bieżący limit i równy lub niższy niż liczba w kolumnie zwiększania limitu przydziału zatwierdzonego automatycznie. Na przykład w przypadku warstwy Podstawowa w danym regionie, jeśli bieżący limit wynosi 16, nowy limit może należeć do zakresu od 17 do 80.

    Warstwa Limit domyślny Automatyczne zatwierdzanie zwiększenia limitu przydziału Łączna suma
    Podstawowy 16 80 96
    S1 16 30 46
    S2 8 10 18
    S3, S3HD 6 10 16
    L1, L2 6 10 16
  6. Prześlij żądanie.

  7. Monitoruj powiadomienia w witrynie Azure Portal, aby uzyskać aktualizacje stanu dla nowego limitu. Większość żądań jest zatwierdzana w ciągu 24 godzin.

Następne kroki

Po aprowizacji usługi możesz kontynuować w portalu, aby utworzyć pierwszy indeks.

Chcesz zoptymalizować i zaoszczędzić na wydatkach na chmurę?