Что такое «Зрение ИИ Azure»?
Служба визуального распознавания ИИ Azure предоставляет доступ к расширенным алгоритмам, обрабатывающим изображения и возвращая информацию на основе визуальных функций, которые вам нужны. В следующей таблице перечислены основные категории продуктов.
Служба | Description |
---|---|
Оптическое распознавание текста (OCR) | Служба оптического распознавания символов (OCR) извлекает текст из изображений. С помощью API чтения можно извлечь печатный и рукописный текст из фотографий и документов. Она использует модели на основе глубокого обучения и работает с текстом на различных поверхностях и фонах. таких как бизнес-документация, счета, квитанции, плакаты, визитные карточки, письма и доски. API OCR поддерживают извлечение печатного текста на нескольких языках. Чтобы приступить к работе, ознакомьтесь с этим руководством. |
Анализ изображений | Служба анализа изображений извлекает множество визуальных элементов из изображений, такие как объекты, лица, содержимое для взрослых и автоматически создаваемые текстовые описания. Чтобы приступить к работе, следуйте краткому руководству по Анализу изображений. |
Распознавание лиц | Служба "Распознавание лиц" предоставляет алгоритмы искусственного интеллекта, которые обнаруживают, распознают и анализируют лица людей в изображениях. Программное обеспечение для распознавания лиц имеет важное значение во многих различных сценариях, таких как идентификация, бесконтактный контроль доступа и размытие лиц для обеспечения конфиденциальности. Чтобы приступить к работе, ознакомьтесь с кратким руководством по службе "Распознавание лиц". |
Анализ видео | Видеоанализ включает функции, связанные с видео, такие как пространственный анализ и извлечение видео. Пространственный анализ анализирует присутствие и перемещение людей в видеотрансляции и создает события, на которые могут реагировать другие системы. Установите контейнер пространственного анализа , чтобы приступить к работе. Получение видео позволяет создавать индекс видео, которые можно искать с помощью естественного языка. |
Azure AI Vision для управления цифровыми активами
Azure AI Vision может использовать множество сценариев управления цифровыми активами (DAM). DAM — это бизнес-процесс организации, хранения и извлечения мультимедийных ресурсов, а также управления цифровыми правами и разрешениями. Например, компании может потребоваться группировать и обозначать изображения на основе видимых логотипов, лиц, объектов, цветов и т. д. Кроме того, вам может потребоваться автоматически создавать подписи для изображений и присоединять ключевые слова, чтобы они могли выполнять поиск. Все решение DAM с помощью служб ИИ Azure, поиска ИИ Azure и интеллектуальной отчетности см. в руководстве по акселератору решений интеллектуального анализа знаний на сайте GitHub. Другие примеры DAM см. в репозитории шаблонов решений визуального распознавания ИИ Azure.
Начало работы
Используйте Visual Studio , чтобы быстро попробовать функции Azure AI Vision в веб-браузере.
Чтобы приступить к созданию Azure AI Vision в приложении, следуйте краткому руководству.
- Краткое руководство. Оптическое распознавание символов (OCR)
- Краткое руководство. Анализ изображений
- Краткое руководство. Распознавание лиц Azure
- Краткое руководство. Использование контейнера пространственного анализа
Требования к изображению
Azure AI Vision может анализировать изображения, соответствующие следующим требованиям:
- Изображение должно быть представлено в формате JPEG, PNG, GIF или BMP.
- Размер файла изображения должен быть меньше 4 МБ.
- Размеры изображения должны быть больше 50 x 50 пикселей
- Для API чтения размеры изображения должны составлять от 50 до 10 000 x 10 000 пикселей.
Конфиденциальность и безопасность данных
Как и во всех службах ИИ Azure, разработчики, использующие службу "Визуальное распознавание ИИ Azure", должны учитывать политики Майкрософт по данным клиентов. Дополнительные сведения см. на странице служб ИИ Azure в Центре управления безопасностью Майкрософт.
Следующие шаги
Следуйте инструкциям краткого руководства по внедрению и запуску службы на предпочитаемом языке разработки.