Légendes d’image (version 4.0)

Les légendes d’image dans Analyse d’image 4.0 sont disponibles via les fonctionnalités Légende et Légendes denses.

La fonctionnalité Légende génère une description en une phrase de tout le contenu de l’image. La fonctionnalité Légendes denses fournit plus de détails en générant des descriptions d’une phrase pour 10 régions différentes de l’image au maximum, en plus de la description de l’image entière. La fonctionnalité Légendes denses renvoie également les coordonnées de cadre englobant les régions d’image décrites. Ces deux fonctionnalités utilisent les derniers modèles IA basés sur Florence.

Les légendes d’images sont disponibles en anglais uniquement.

Important

Le sous-titrage d’images dans l’analyse d’image 4.0 est disponible uniquement dans certaines régions de centre de données Azure : consultez Disponibilité régionale. Vous devez utiliser une ressource Azure AI Vision située dans l’une de ces régions pour obtenir des résultats à partir des fonctionnalités Légende et Légendes denses.

Si vous devez utiliser une ressource Vision en dehors de ces régions pour générer des légendes d’images, utilisez Analyse Image 3.2, qui est disponible dans toutes les régions Azure AI Vision.

Essayez les fonctionnalités de légende d’images rapidement et facilement dans votre navigateur à l’aide de Vision Studio.

Légendes non genrées

Par défaut, les légendes contiennent les termes de genre (« homme », « femme », « garçon » et « fille »). Vous avez la possibilité de remplacer ces termes par « personne » dans vos résultats et obtenir ainsi des légendes non genrées. Pour ce faire, affectez la valeur true au paramètre de requête d’API facultatif gender-neutral-caption dans l’URL de requête.

Exemples de légendes et de légendes denses

La réponse JSON suivante illustre ce que retourne l’API Analyse Image 4.0 quand elle décrit l’exemple d’image en fonction de ses caractéristiques visuelles.

Photo d’un homme pointant vers un écran

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Utilisation de l’API

La fonctionnalité de légende d’image fait partie de l’API Analyse Image. Incluez Caption dans le paramètre de requête features. Ensuite, lorsque vous obtenez la réponse JSON complète, analysez la chaîne de contenu de la section "captionResult".

Étapes suivantes