Co to jest usługa Azure AI Vision?

Artykuł
09/29/2024

Usługa Azure AI Vision zapewnia dostęp do zaawansowanych algorytmów, które przetwarzają obrazy i zwracają informacje na podstawie interesujących Cię funkcji wizualnych. W poniższej tabeli wymieniono główne kategorie produktów.

Usługa	opis
Optyczne rozpoznawanie znaków (OCR)	Usługa optycznego rozpoznawania znaków (OCR) wyodrębnia tekst z obrazów. Interfejs API odczytu umożliwia wyodrębnianie tekstu drukowanego i odręcznego ze zdjęć i dokumentów. Używa modeli opartych na uczeniu głębokim i współpracuje z tekstem na różnych powierzchniach i tłach. Należą do nich dokumenty biznesowe, faktury, paragony, plakaty, wizytówki, listy i tablice. Interfejsy API OCR obsługują wyodrębnianie tekstu drukowanego w kilku językach. Postępuj zgodnie z przewodnikiem Szybki start usługi OCR, aby rozpocząć pracę.
Analiza obrazu	Usługa Analiza obrazów wyodrębnia wiele funkcji wizualnych z obrazów, takich jak obiekty, twarze, zawartość dla dorosłych i automatycznie generowane opisy tekstu. Postępuj zgodnie z przewodnikiem Szybki start Analizy obrazów, aby rozpocząć pracę.
Rozpoznawanie twarzy	Usługa rozpoznawania twarzy udostępnia algorytmy sztucznej inteligencji, które wykrywają, rozpoznawają i analizują ludzkie twarze na obrazach. Oprogramowanie do rozpoznawania twarzy jest ważne w wielu różnych scenariuszach, takich jak identyfikacja, bezobsługowa kontrola dostępu i rozmycie twarzy w celu zachowania prywatności. Postępuj zgodnie z przewodnikiem Szybki start rozpoznawania twarzy, aby rozpocząć pracę.
Analiza wideo	Analiza wideo obejmuje funkcje związane z wideo, takie jak analiza przestrzenna i pobieranie wideo. Analiza przestrzenna analizuje obecność i ruch osób w kanale wideo i generuje zdarzenia, na które mogą reagować inne systemy. Zainstaluj kontener Analizy przestrzennej, aby rozpocząć pracę. Pobieranie wideo umożliwia utworzenie indeksu filmów wideo, które można wyszukiwać za pomocą języka naturalnego.

Usługa Azure AI Vision na potrzeby zarządzania zasobami cyfrowymi

Usługa Azure AI Vision może zasilać wiele scenariuszy zarządzania zasobami cyfrowymi (DAM). DAM to proces biznesowy organizowania, przechowywania i pobierania bogatych zasobów multimedialnych oraz zarządzania prawami cyfrowymi i uprawnieniami. Na przykład firma może chcieć grupować i identyfikować obrazy na podstawie widocznych logo, twarzy, obiektów, kolorów itd. Możesz też automatycznie generować podpisy dla obrazów i dołączać słowa kluczowe, aby można je było przeszukiwać. Aby zapoznać się z rozwiązaniem all-in-one DAM korzystającym z usług Azure AI, Azure AI Search i inteligentnego raportowania, zobacz Przewodnik po akceleratorze rozwiązań do wyszukiwania wiedzy w witrynie GitHub. Aby zapoznać się z innymi przykładami dam, zobacz repozytorium Szablony rozwiązań usługi Azure AI Vision.

Rozpocznij

Użyj programu Vision Studio , aby szybko wypróbować funkcje usługi Azure AI Vision w przeglądarce internetowej.

Aby rozpocząć tworzenie usługi Azure AI Vision w aplikacji, postępuj zgodnie z przewodnikiem Szybki start.

Wymagania dotyczące obrazu

Usługa Azure AI Vision może analizować obrazy spełniające następujące wymagania:

Obraz musi być w formacie JPEG, PNG, GIF lub BMP
Rozmiar pliku obrazu musi być mniejszy niż 4 megabajty (MB)
Wymiary obrazu muszą być większe niż 50 x 50 pikseli
- W przypadku interfejsu API odczytu wymiary obrazu muszą mieć od 50 x 50 do 10 000 x 10 000 pikseli.

Prywatność i zabezpieczenia danych

Podobnie jak we wszystkich usługach azure AI, deweloperzy korzystający z usługi Azure AI Vision powinni mieć świadomość zasad firmy Microsoft dotyczących danych klientów. Aby dowiedzieć się więcej, zobacz stronę usługi Azure AI w Centrum zaufania firmy Microsoft.

Następne kroki

Postępuj zgodnie z przewodnikiem Szybki start, aby zaimplementować i uruchomić usługę w preferowanym języku programowania.

Udostępnij za pośrednictwem