Qu’est-ce que la recherche Azure AI ?

Azure AI Search (anciennement appelé « Recherche cognitive Azure ») est un système de recherche et de récupération prêts pour l’entreprise, avec un ensemble complet de technologies de recherche avancée, conçues pour les applications hautes performances à n’importe quelle échelle.

Azure AI Search est le système de récupération recommandé principal lors de la création d’applications basées sur RAG sur Azure, avec des intégrations LLM natives entre Azure OpenAI Service et Azure Machine Learning.

La Recherche Azure AI peut être utilisé dans les scénarios traditionnels et GenAI. Les cas d’usage courants incluent les insights de la base de connaissances (recherche de catalogue ou de documents), la découverte d’informations (exploration des données), la génération augmentée de récupération (RAG) et l’automatisation.

Lorsque vous créez un service de recherche, vous utilisez les fonctionnalités suivantes :

D’un point de vue architectural, un service de recherche se trouve entre les magasins de données externes qui contiennent vos données non indexées et votre application cliente qui envoie des demandes de requête à un index de recherche et gère la réponse.

Architecture de Recherche Azure AI

Dans votre application cliente, l’expérience de recherche est définie au moyen d’API provenant de la recherche Azure AI ; elle peut inclure le paramétrage de la pertinence, le classement sémantique, la saisie semi-automatique, la correspondance des synonymes, la correspondance approximative, les critères spéciaux, le filtrage et le tri.

Dans la plateforme Azure, la recherche Azure AI peut s’intégrer à d’autres services Azure. Elle le fait sous la forme d’indexeurs qui automatisent l’ingestion ou la récupération des données à partir de sources de données Azure, et sous la forme d’ensembles de compétences qui incorporent l’IA consommable des Azure AI services (comme l’analyse des images et le traitement en langage naturel) ou l’IA personnalisée que vous créez dans Azure Machine Learning ou incluez dans un wrapper dans Azure Functions.

À l’intérieur d’un service de recherche

Sur le service de recherche proprement dit, les deux charges de travail principales sont l’indexation et l’interrogation.

  • L’indexation est un processus d’entrée qui charge du contenu dans votre service de recherche et le rend consultable. En interne, le texte entrant est traité en jetons et stocké dans des index inversés, et les vecteurs entrants sont stockés dans des index vectoriels. Le format de document que la recherche Azure AI peut indexer est JSON. Vous pouvez charger des documents JSON que vous avez assemblés, ou utiliser un indexeur pour récupérer et sérialiser vos données en JSON.

    L’IA appliquée via un ensemble de compétences étend l’indexation avec des modèles d’image et de langage. Si vous avez des images ou du texte non structuré dans un document source, vous pouvez ajouter des compétences qui effectuent la reconnaissance optique de caractères (OCR), analysent et décrivent les images, déduisent la structure, traduisent le texte et plus encore. La sortie est du texte qui peut être sérialisé en JSON et ingéré dans un index de recherche.

    Les ensembles de compétences peuvent également effectuer la segmentation et vectorisation des données lors de l’indexation. Les compétences liées à Azure OpenAI, au catalogue de modèles d’Azure AI Studio ou les compétences personnalisées liées à tout modèle externe de segmentation et d’intégration peuvent être utilisées lors de l’indexation pour créer des données vectorielles. La sortie est un contenu vectoriel segmenté qui peut être intégré dans un index de recherche.

  • L’interrogation peut avoir lieu une fois qu’un index est rempli avec du texte pouvant faire l’objet d’une recherche, quand votre application cliente envoie des demandes de requête à un service de recherche et gère les réponses. Toutes les exécutions de requête se situent sur un index de recherche que vous contrôlez.

    Le classement sémantique est une extension de l’exécution de requête. Cela permet d’ajouter un classement secondaire, en utilisant la compréhension du langage pour réévaluer un ensemble de résultats, et de promouvoir les résultats les plus pertinents sur le plan sémantique en tête de liste.

    La vectorisation intégrée est également une extension de l’exécution des requêtes. Si vous disposez de champs vectoriels dans votre index de recherche, vous pouvez envoyer des requêtes vectorielles brutes ou du texte vectorisé au moment de la requête.

La recherche Azure AI est adapté aux scénarios d’application suivants :

  • Utilisez-le pour la recherche en texte intégral traditionnel et la recherche vectorielle de similarité nouvelle génération. Revenez à vos applications d’IA générative avec récupération d’informations qui tire parti des forces du mot clé et de la recherche de similarité. Utilisez les deux modalités pour récupérer les résultats les plus pertinents.

  • Consolidez le contenu hétérogène dans un index de recherche défini par l’utilisateur et rempli composé de vecteurs et de texte. Vous conservez la propriété et le contrôle de ce qui peut faire l’objet de recherches.

  • Intégrer la segmentation et la vectorisation des données pour les applications IA et RAG génératives.

  • Appliquer un contrôle d’accès granulaire au niveau du document.

  • Déchargez les charges de travail d’indexation et de requête sur un service de recherche dédié.

  • Implémentez facilement les fonctionnalités de recherche : le réglage de la pertinence, la navigation par facettes, les filtres (y compris la recherche géospatiale), le mappage de synonymes et la saisie semi-automatique.

  • Transformez en segments recherchables de volumineux fichiers image ou texte indifférenciés ou des fichiers d’application stockés dans Stockage Blob Azure ou Azure Cosmos DB. Pour ce faire, l’indexation s’appuie sur des compétences IA qui ajoutent un traitement externe à partir d’Azure AI.

  • Ajoutez une analyse de texte linguistique ou personnalisée. Si vous disposez d’un contenu autre que l’anglais, la recherche Azure AI prend en charge les analyseurs Lucene et les processeurs de langage naturel de Microsoft. Vous pouvez également configurer des analyseurs pour obtenir un traitement spécialisé de contenu brut, tel que le filtrage des signes diacritiques, ou la reconnaissance et la conservation de modèles dans les chaînes.

Pour plus d’informations sur les fonctionnalités spécifiques, consultez Fonctionnalités de la recherche Azure AI

Pour commencer

Cette fonctionnalité est exposée par le biais du portail Azure, d’une simple API REST ou de SDK Azure tels que le SDK Azure pour .NET. Le portail Azure prend en charge l’administration de service et la gestion de contenu, avec des outils de prototypage et d’interrogation de vos index et votre ensemble de compétences.

Utilisation du portail Azure

Une exploration de bout en bout des fonctionnalités de recherche de base peut être effectuée en quatre étapes :

  1. Choisissez un niveau et une région. Un seul service de recherche est autorisé par abonnement. Tous les démarrages rapides peuvent être effectués au niveau gratuit. Pour plus de capacités et de fonctionnalités, vous aurez besoin d'un niveau facturable.

  2. Créer un service de recherche dans le portail.

  3. Démarrez l’Assistant Importation de données. Choisissez un échantillon intégré ou une source de données prise en charge pour créer, charger et interroger un index en quelques minutes.

  4. Terminez avec l’Explorateur de recherche, en utilisant un client de portail pour interroger l'index de recherche que vous venez de créer.

Utiliser des API

Vous pouvez également créer, charger et interroger un index de recherche de manière atomique :

  1. Créez un index de recherche à l’aide du portail, de l’API REST, du SDK .NET ou d’un autre SDK. Le schéma d’index définit la structure du contenu pouvant être recherché.

  2. Chargez du contenu à l’aide du modèle « Push » pour envoyer (push) des documents JSON à partir de n’importe quelle source, ou utilisez le modèle « Pull » (indexeurs) si vos données sont d’un type pris en charge.

  3. Interrogez un index avec l’Explorateur de recherche dans le portail, l’API REST, le SDK .NET ou un autre SDK.

Pour utiliser les accélérateurs

Ou essayez les accélérateurs de solution :

  • L’accélérateur de solution Échanger avec vos données vous aide à créer une solution RAG personnalisée sur votre contenu.

  • L’accélérateur de solution Exploration des connaissances conversationnelles vous aide à créer une solution interactive pour extraire des informations exploitables à partir de transcriptions recueillies dans les centres de contact.

  • L’accélérateur d’exploration de connaissances de document vous permet de traiter et d’extraire des résumés, des entités et des métadonnées de documents multimodaux non structurés.

  • L’accélérateur de solution Build your own Copilot s'appuie sur Azure OpenAI Service, Recherche Azure AI et Microsoft Fabric pour créer des solutions de copilotage personnalisées.

    • Le copilote générique vous aide à créer votre propre copilote pour identifier les documents pertinents, synthétiser les informations non structurées et générer des modèles de documents Word à l’aide de vos propres données.

    • Le copilote personnalisé tout-en-un Client Advisor permet à Client Advisor d’exploiter la puissance de l’IA générative sur les données structurées et non structurées. Aider nos clients à optimiser les tâches quotidiennes et à favoriser de meilleures interactions avec d’autres clients

    • L’assistant de recherche vous permet de générer votre propre assistant IA pour identifier les documents pertinents, résumer et catégoriser de vastes quantités d’informations non structurées et accélérer la révision globale de documents et la génération de contenu.

Conseil

Pour obtenir de l’aide sur les solutions complexes ou personnalisées, contactez un partenaire disposant d’une expertise approfondie de la technologie de recherche Azure AI.

Comparer les options de recherche

Les clients souhaitent souvent comparer les performances de la recherche Azure AI par rapport à d’autres solutions de recherche. Le tableau suivant récapitule ces différences clés.

Par rapport à Différences clés
Recherche Microsoft Recherche Microsoft est destinée aux utilisateurs authentifiés Microsoft 365 qui doivent interroger du contenu dans SharePoint. Recherche Azure AI extrait du contenu à partir d’Azure et de n’importe quel jeu de données au format JSON.
Bing Les API Bing interrogent les index de Bing.com afin de trouver des correspondances pour les termes recherchés. Recherche Azure AI explore le contenu que vous avez placé sur les index. Vous contrôlez l’ingestion des données, ainsi que le schéma.
Recherche de base de données Azure SQL propose la recherche en texte intégral et la recherche vectorielle. Azure Cosmos DB propose également la recherche de texte et la recherche vectorielle. Recherche Azure AI peut s’avérer intéressant quand vous recherchez des fonctionnalités telles que le réglage de la pertinence ou l’intégration de contenus provenant de sources diverses. L’utilisation des ressources est un autre point d’inflexion. L’indexation et les requêtes sont gourmandes en calcul. La recherche de déchargement du SGBD (système de gestion de base de données) conserve les ressources système pour le traitement transactionnel.
Solution de recherche dédiée En partant du principe que vous avez choisi la recherche dédiée avec l’ensemble des fonctionnalités, une dernière comparaison catégorielle se fera entre les différentes technologies de recherche. Pour les applications qui s’appuient principalement sur la recherche pour récupérer des informations et parcourir le contenu, Recherche Azure AI se distingue comme la solution la plus efficace parmi les fournisseurs de services cloud pour ce qui relève des charges de travail de recherche vectorielle, par mot clé et hybride sur les contenus hébergés sur Azure.

Voici les principaux atouts :

  • Prise en charge de l’indexation et des requêtes vectorielles et non vectorielles (texte). Grâce à la recherche de similarité vectorielle, vous pouvez trouver des informations sémantiquement similaires aux requêtes de recherche, même en cas de non-correspondance exacte des termes de recherche. Utilisez la recherche hybride pour bénéficier des avantages combinés de la recherche par mot clé et de la recherche vectorielle.
  • Réglage du classement et de la pertinence à l’aide du classement sémantique et de profils de score. La syntaxe de requête prend en charge le boosting des termes et la hiérarchisation des champs.
  • Intégration de données Azure (robots) au niveau de la couche d’indexation.
  • Accédez aux intégrations d’Azure AI pour les transformations qui permettent la recherche sur le texte et les vecteurs de contenus.
  • Bénéficiez de la sécurité Microsoft Entra pour les connexions approuvées et de la sécurité Azure Private Link pour les connexions privées dans les scénarios sans Internet.
  • Expérience de recherche intégrale : effectuez des analyses de texte linguistiques et personnalisées dans 56 langues. Utilisez les facettes, les requêtes de saisie semi-automatique, les résultats suggérés et les synonymes.
  • Profitez de la mise à l’échelle, de la fiabilité et de la portée globale d’Azure.