Что такое «Зрение ИИ Azure»?

Статья
09/29/2024

Служба визуального распознавания ИИ Azure предоставляет доступ к расширенным алгоритмам, обрабатывающим изображения и возвращая информацию на основе визуальных функций, которые вам нужны. В следующей таблице перечислены основные категории продуктов.

Служба	Description
Оптическое распознавание текста (OCR)	Служба оптического распознавания символов (OCR) извлекает текст из изображений. С помощью API чтения можно извлечь печатный и рукописный текст из фотографий и документов. Она использует модели на основе глубокого обучения и работает с текстом на различных поверхностях и фонах. таких как бизнес-документация, счета, квитанции, плакаты, визитные карточки, письма и доски. API OCR поддерживают извлечение печатного текста на нескольких языках. Чтобы приступить к работе, ознакомьтесь с этим руководством.
Анализ изображений	Служба анализа изображений извлекает множество визуальных элементов из изображений, такие как объекты, лица, содержимое для взрослых и автоматически создаваемые текстовые описания. Чтобы приступить к работе, следуйте краткому руководству по Анализу изображений.
Распознавание лиц	Служба "Распознавание лиц" предоставляет алгоритмы искусственного интеллекта, которые обнаруживают, распознают и анализируют лица людей в изображениях. Программное обеспечение для распознавания лиц имеет важное значение во многих различных сценариях, таких как идентификация, бесконтактный контроль доступа и размытие лиц для обеспечения конфиденциальности. Чтобы приступить к работе, ознакомьтесь с кратким руководством по службе "Распознавание лиц".
Анализ видео	Видеоанализ включает функции, связанные с видео, такие как пространственный анализ и извлечение видео. Пространственный анализ анализирует присутствие и перемещение людей в видеотрансляции и создает события, на которые могут реагировать другие системы. Установите контейнер пространственного анализа , чтобы приступить к работе. Получение видео позволяет создавать индекс видео, которые можно искать с помощью естественного языка.

Azure AI Vision для управления цифровыми активами

Azure AI Vision может использовать множество сценариев управления цифровыми активами (DAM). DAM — это бизнес-процесс организации, хранения и извлечения мультимедийных ресурсов, а также управления цифровыми правами и разрешениями. Например, компании может потребоваться группировать и обозначать изображения на основе видимых логотипов, лиц, объектов, цветов и т. д. Кроме того, вам может потребоваться автоматически создавать подписи для изображений и присоединять ключевые слова, чтобы они могли выполнять поиск. Все решение DAM с помощью служб ИИ Azure, поиска ИИ Azure и интеллектуальной отчетности см. в руководстве по акселератору решений интеллектуального анализа знаний на сайте GitHub. Другие примеры DAM см. в репозитории шаблонов решений визуального распознавания ИИ Azure.

Начало работы

Используйте Visual Studio , чтобы быстро попробовать функции Azure AI Vision в веб-браузере.

Чтобы приступить к созданию Azure AI Vision в приложении, следуйте краткому руководству.

Требования к изображению

Azure AI Vision может анализировать изображения, соответствующие следующим требованиям:

Изображение должно быть представлено в формате JPEG, PNG, GIF или BMP.
Размер файла изображения должен быть меньше 4 МБ.
Размеры изображения должны быть больше 50 x 50 пикселей
- Для API чтения размеры изображения должны составлять от 50 до 10 000 x 10 000 пикселей.

Конфиденциальность и безопасность данных

Как и во всех службах ИИ Azure, разработчики, использующие службу "Визуальное распознавание ИИ Azure", должны учитывать политики Майкрософт по данным клиентов. Дополнительные сведения см. на странице служб ИИ Azure в Центре управления безопасностью Майкрософт.

Следующие шаги

Следуйте инструкциям краткого руководства по внедрению и запуску службы на предпочитаемом языке разработки.

Поделиться через