FREETEXT (Transact-SQL)

Prédicat utilisé dans une clause WHERE pour rechercher dans les colonnes contenant des types de données à base de caractères les valeurs qui correspondent à la signification et non pas juste à la syntaxe exacte des mots dans la condition de recherche. Lorsque FREETEXT est utilisé, le moteur de recherche en texte intégral effectue les actions suivantes sur la chaîne freetext_string, il affecte un poids à chaque terme, puis il recherche les correspondances.

  • Il scinde la chaîne en mots en se basant sur les limites de mot (coupure de mots).

  • Il génère des formes fléchies des mots (extraction de la racine).

  • Il identifie une liste d'extensions ou de substituts en fonction des correspondances fournies par le dictionnaire des synonymes.

Icône Lien de rubriqueConventions de syntaxe Transact-SQL

Syntaxe

FREETEXT ( { column_name | (column_list) | * } 
          , 'freetext_string' [ , LANGUAGE language_term ] )

Arguments

  • column_name
    Nom d'une ou de plusieurs colonnes de texte intégral indexées de la table spécifiée dans la clause FROM. Les colonnes peuvent être de type char, varchar, nchar, nvarchar, text, ntext, image, xml, varbinary ou varbinary(max).

  • column_list
    Indique que plusieurs colonnes, délimitées par des virgules, peuvent être spécifiées. L'argument column_list doit être mis entre parenthèses. Une seule et même langue doit être utilisée dans toutes les colonnes de column_list, sauf si language_term est spécifié.

  • *
    Précise que toutes les colonnes enregistrées pour la recherche en texte intégral doivent être utilisées pour rechercher la chaîne freetext_string donnée. Si la clause FROM comporte plusieurs tables, * doit être qualifié par le nom de la table. Si language_term n'est pas précisé, la langue de toutes les colonnes de la table doit être la même.

  • freetext_string
    Texte à rechercher dans column_name. Tout texte, y compris des mots, expressions et phrases peuvent être entrés. Des correspondances sont générées si l'un des termes ou les formes de quelque terme que ce soit sont trouvés dans l'index de recherche en texte intégral.

    À la différence de la condition de recherche CONTAINS et CONTAINSTABLE où AND est un mot clé, le mot « and » est considéré comme un mot parasite, où mot vide dans freetext_string et il est ignoré.

    L'utilisation de WEIGHT, de FORMSOF, de caractères génériques, de NEAR et d'autres syntaxes n'est pas autorisée. La chaîne freetext_string est découpée en mots dont les racines sont extraites et traitées par le dictionnaire des synonymes. Si freetext_string est placé entre guillemets doubles, c'est une correspondance globale qui est effectuée ; les étapes de recherche de radical et d'utilisation du dictionnaire de synonymes ne sont pas effectuées.

    freetext_string est de type nvarchar. Une conversion implicite se produit lorsqu'un autre type de données caractères est utilisé comme entrée. Dans l'exemple suivant, la variable @SearchWord, à laquelle est attribuée la valeur varchar(30), provoque une conversion implicite dans le prédicat FREETEXT.

    USE AdventureWorks;
    GO
    DECLARE @SearchWord varchar(30)
    SET @SearchWord ='performance'
    SELECT Description 
    FROM Production.ProductDescription 
    WHERE FREETEXT(Description, @SearchWord);
    

    Étant donné que la détection des paramètres ne fonctionne pas lors de la conversion, utilisez nvarchar afin d'obtenir de meilleures performances. Dans l'exemple, déclarez @SearchWord en tant que nvarchar(30).

    USE AdventureWorks;
    GO
    DECLARE @SearchWord nvarchar(30)
    SET @SearchWord = N'performance'
    SELECT Description 
    FROM Production.ProductDescription 
    WHERE FREETEXT(Description, @SearchWord);
    

    Vous pouvez également utiliser l'indicateur de requête OPTIMIZE FOR lorsqu'un plan non optimal est généré.

  • LANGUAGE language_term
    Langue dont les ressources seront utilisées pour l'analyse lexicale, la recherche de radical, l'utilisation du dictionnaire de synonymes et la suppression de mots vides dans la requête. Ce paramètre est facultatif et peut être spécifié sous la forme d'une chaîne, d'un entier ou d'une valeur hexadécimale correspondant à l'identificateur de paramètres régionaux (LCID) d'une langue. Si vous spécifiez language_term, la langue qu'il représente est appliquée à tous les éléments de la condition de recherche. Si aucune valeur n'est définie, la langue de texte intégral de la colonne est utilisée.

    Si des documents de langues différentes sont stockés ensemble en tant qu'objets BLOB dans une colonne unique, l'identificateur de paramètres régionaux (LCID) d'un document donné détermine la langue utilisée pour l'indexation de son contenu. Lors de l'interrogation d'une telle colonne, la spécification de LANGUAGElanguage_term permet d'augmenter la probabilité d'une correspondance correcte.

    Lorsqu'il est spécifié comme chaîne, l'argument language_term correspond à la valeur de la colonne alias dans la vue de compatibilité sys.syslanguages (Transact-SQL). La chaîne doit être placée entre guillemets simples, comme dans la chaîne 'language_term'. Lorsqu'il est spécifié sous forme de nombre entier, language_term représente le LCID réel qui identifie la langue. Quand il est spécifié comme valeur hexadécimale, l'argument language_term est 0x suivi de la valeur hexadécimale du LCID. La valeur hexadécimale ne doit pas dépasser huit caractères, y compris les zéros non significatifs.

    Si la valeur est au format de jeu de caractères codés sur deux octets (DBCS), MicrosoftSQL Server la convertit en Unicode.

    Si la langue spécifiée n'est pas valide ou s'il n'existe aucune ressource installée correspondant à cette langue, MicrosoftSQL Server retourne une erreur. Pour utiliser des ressources linguistiques neutres, indiquez 0x0 pour language_term.

Notes

Les prédicats et les fonctions de texte intégral s'appliquent à une table unique, ce qui est implicite dans le prédicat FROM. Pour effectuer des recherches sur plusieurs tables, utilisez une table jointe dans votre clause FROM afin de baser votre recherche sur un jeu de résultats qui est le produit de deux tables ou plus.

Les requêtes de texte intégral qui utilisent FREETEXT sont moins précises que celles qui utilisent CONTAINS. Le moteur de recherche en texte intégral de SQL Server identifie les expressions et les mots importants. Aucune signification particulière n'est donnée aux mots clés réservés ni aux caractères génériques qui ont généralement un sens lorsqu'ils sont précisés dans le paramètre <contains_search_condition> du prédicat CONTAINS.

FREETEXT n'est pas reconnu en tant que mot clé si le niveau de compatibilité est inférieur à 70. Pour plus d'informations, consultez sp_dbcmptlevel (Transact-SQL).

Les prédicats de texte intégral ne sont pas autorisés dans la clause OUTPUT lorsque le niveau de compatibilité de la base de données a la valeur 100.

Exemples

A. Utilisation de FREETEXT pour rechercher des mots contenant les valeurs de caractère spécifiées

L'exemple suivant recherche tous les documents contenant les mots liés à « vital », « safety» et « components ».

USE AdventureWorks;
GO
SELECT Title
FROM Production.Document
WHERE FREETEXT (Document, 'vital safety components' );
GO

B. Utilisation de FREETEXT avec des variables

L'exemple ci-dessous utilise une variable à la place d'un terme de recherche spécifique.

USE AdventureWorks;
GO
DECLARE @SearchWord nvarchar(30);
SET @SearchWord = N'high-performance';
SELECT Description 
FROM Production.ProductDescription 
WHERE FREETEXT(Description, @SearchWord);
GO