Como editar um arquivo de dicionário de sinônimos (Pesquisa de Texto Completo)

É possível configurar o dicionário de sinônimos de um idioma editando seu arquivo (um arquivo XML). Durante a instalação, os arquivos vazios do dicionário de sinônimos que só incluem o contêiner <xml> e um elemento de exemplo do <dicionário de sinônimos> inserido como comentário são instalados. Para que as consultas de pesquisa de texto completo que procuram sinônimos funcionem adequadamente, crie um elemento real do <dicionário de sinônimos> que defina um conjunto de sinônimos. Você pode definir duas formas de sinônimos: conjuntos de expansão e de substituição. Para obter informações sobre o local e estrutura de um arquivo de dicionário de sinônimos, consulte Configuração do Thesaurus.

Restrições para arquivos de dicionário de sinônimos

As seguintes restrições se aplicam à edição de um arquivo de dicionário de sinônimos:

  • Somente administradores de sistema podem atualizar, modificar ou excluir arquivos de dicionário de sinônimos.

  • Ao editar arquivos de dicionários de sinônimos usando ferramentas de editores de texto, é necessário salvá-los no formato Unicode e especificar Marcas de Ordem de Byte.

  • As entradas de dicionário de sinônimos não podem estar vazias, nem pode haver separação de palavras para uma cadeia de caracteres vazia.

  • As frases no arquivo de dicionário de sinônimos não devem ter mais de 512 caracteres.

  • Um dicionário de sinônimos não deve conter entradas duplicadas entre as entradas <sub> de conjuntos de expansão e os elementos <pat> de conjuntos de substituição.

Recomendações para arquivos de dicionário de sinônimos

Recomendamos que as entradas no arquivo do dicionário de sinônimos não contenham caracteres especiais. Isso ocorre porque os separadores de palavras têm comportamentos sutis em relação a caracteres especiais. Se uma entrada de dicionário de sinônimos contiver caracteres especiais, os separadores de palavras usados com essa entrada poderão ter implicações de comportamento sutis para uma consulta de texto completo.

Recomendamos que as entradas <sub> não contenham palavras irrelevantes pois tais palavras são omitidas do índice de texto completo. As consultas são expandidas para incluir as entradas <sub> de um arquivo de dicionário de sinônimos e, se uma entrada <sub> contiver palavras irrelevantes, o tamanho da consulta aumentará desnecessariamente.

Para editar um arquivo de dicionário de sinônimos

  1. Abra o arquivo de dicionário de sinônimos no Bloco de Notas.

  2. Se você estiver editando um arquivo de dicionário de sinônimos pela primeira vez, remova as seguintes linhas de comentário no início e final do arquivo, respectivamente:

    <!--Commented out
    -->
    
  3. Adicione, modifique ou exclua um conjunto de substituições ou conjunto de expansão. Para obter mais informações, consulte Configuração do Thesaurus.

  4. Salve o arquivo e feche o Bloco de Notas.

  5. Use sp_fulltext_load_thesaurus_file para carregar o conteúdo do arquivo de dicionário de sinônimos no tempdb, especificando o LCID (identificador de localidade) correspondente ao idioma do arquivo. Por exemplo, para o arquivo do dicionário de sinônimos em inglês, tsenu.xml, o LCID correspondente é 1033.

    USE AdventureWorks2008R2 ;
    EXEC sys.sp_fulltext_load_thesaurus_file 1033;
    GO