Включение рекомендуемой одежды наблюдаемого человека

При индексировании видео с помощью расширенных параметров индексатора видео с помощью Azure AI Video Indexer можно просмотреть представленную одежду наблюдаемого человека. Понимание предоставляет моменты в видео, где ключевые люди видно и четко видны, включая координаты людей, метку времени и кадр выстрела. Это представление позволяет высококачественной контекстной рекламе в видео, где соответствующие объявления одежды соответствуют определенному времени в видео, в котором они просматриваются.

В этой статье описывается, как просмотреть аналитические сведения о одежде и о том, как оцениваются избранные изображения одежды.

Просмотр видео интро

Вы можете просмотреть следующее короткое видео, в котором описывается, как просматривать и использовать полезные сведения о одежде.

Подробные сведения о одежде доступны при индексировании файла, выбрав вариант "Дополнительно" —> дополнительное видео или дополнительное видео + аудиозапись (в разделе "Видео + аудио индексирование"). Стандартная индексация не включает эту информацию.

Снимок экрана: параметр индексирования видео.

Избранные изображения одежды ранжируются на основе некоторых из следующих факторов: ключевые моменты видео, длительность появления человека, текстовые эмоции и звуковые события. Аналитика приватирует самый высокий рейтинг кадра на сцену, что позволяет создавать контекстные объявления на сцену на протяжении всего видео. JSON-файл ранжируется по последовательности сцен в видео, при этом каждая сцена имеет верхний рейтинг кадра в качестве результата.

Примечание.

Аналитические сведения о доступной одежде можно просмотреть только из файла артефакта, а аналитические сведения не отображаются на веб-сайте Индексатора видео Azure.

  1. В правом верхнем углу выберите, чтобы скачать ZIP-файл артефакта: скачать ->Artifact (ZIP)
  2. Открыть featuredclothing.zip.

Файл .zip содержит два объекта:

  • featuredclothing.map.json — файл содержит экземпляры каждой рекомендуемой одежды со следующими свойствами:

    • id — индекс ранжирования ("id": 1 является самой важной одеждой).
    • confidence — оценка рекомендуемой одежды.
    • frameIndex - лучший кадр одежды.
    • timestamp — соответствует frameIndex.
    • opBoundingBox — ограничивающий прямоугольник человека.
    • faceBoundingBox — ограничивающий прямоугольник лица человека, если обнаружен.
    • fileName - где сохраняется лучший кадр одежды.
    • sceneID — сцена, в которой отображается сцена.

    Пример рекомендуемой одежды с "sceneID": 1.

    "instances": [
      	{
        		"confidence": 0.07,
    			"faceBoundingBox": {},
    			"fileName": "frame_100.jpg",
        		"frameIndex": 100,
        		"opBoundingBox": {
            			"x": 0.09062,
            			"y": 0.4,
    				"width": 0.11302,
            			"height": 0.59722
    				},
       			 "timestamp": "0:00:04",
        		"personName": "Observed Person #1",
        		"sceneId": 1
      	}
    
  • featuredclothing.frames.map — эта папка содержит изображения лучших кадров, в которых появилась представленная одежда, соответствующая свойству fileName в каждом экземпляре featuredclothing.map.json.

Допущения и ограничения

Важно отметить ограничения признаков одежды, чтобы избежать или смягчить последствия ложных обнаружения изображений с низким качеством или низкой релевантности. 

  • Предварительные условия для рекомендуемой одежды заключается в том, что человек, одетый в одежду, можно найти в наблюдаемых людях понимание.
  • Если лицо человека, надетого в рекомендуемую одежду, не обнаруживается, результаты не включают ограничивающий прямоугольник лиц.
  • Если человек в видео носит более одного наряда, алгоритм выбирает свой лучший наряд в качестве единого изображения одежды.
  • При позе треки оптимизированы для обработки наблюдаемых людей, которые чаще всего появляются на переднем крае.
  • Ошибки обнаружения могут возникать при перекрытии людей.
  • Кадры, содержащие размытые люди, более подвержены низкому качеству результатов.

Дополнительные сведения см. в ограничениях наблюдаемых людей.