Alterações de comportamento na pesquisa de texto completo

Este tópico descreve alterações de comportamento em pesquisa de texto completo. As alterações de comportamento afetam como os recursos funcionam ou interagem no SQL Server 2014 em comparação com versões anteriores do SQL Server.

Alterações de comportamento na pesquisa de Full-Text no SQL Server 2014

Informações que virão posteriormente.

Alterações de comportamento na pesquisa de Full-Text no SQL Server 2012

SQL Server 2012 instala uma nova versão dos separadores de palavras e lematizadores para inglês dos EUA (LCID 1033) e inglês do Reino Unido (LCID 2057). Porém, você poderá alternar para a versão anterior desses componentes se desejar reter o comportamento anterior. Para obter mais informações, consulte Alterar o separador de palavras usado para inglês (EUA) e inglês (Reino Unido).

Novos separadores de palavras e lematizadores instalados

SQL Server 2012 atualiza todos os separadores de palavras e lematizadores usados pelo Full-Text Pesquisa e Pesquisa Semântica. Para obter consistência entre o conteúdo de índices e os resultados das consultas, nós recomendamos que você repopule os índices de texto completo existentes.

  1. Há novos separadores de palavras para inglês. Se você tiver que manter o comportamento anterior, consulte Change the Word Breaker Used for US English and UK English.

  2. Os separadores de palavras de terceiros para dinamarquês, polonês e turco que foram incluídos em versões anteriores de SQL Server foram substituídos por componentes da Microsoft. Os novos componentes estão habilitados por padrão.

  3. Há novos separadores de palavras para tcheco e grego. Versões anteriores do SQL Server Full-Text Search não incluíram suporte para esses dois idiomas.

Alterações de comportamento de novos separadores de palavras e lematizadores

Os novos componentes podem retornar resultados diferentes dos componentes mais antigos quando você popula e consulta índices de texto completo. As tabelas a seguir demonstram algumas das diferenças que podem ser esperadas em resultados em inglês.

Se você tiver que reter o comportamento anterior dos separadores de palavras e lematizadores, consulte os tópicos seguintes:

Em alguns casos, os novos componentes retornam mais resultados:

Termo Resultados com separador de palavras e lematizador anterior Resultados com novo separador de palavras e lematizador
cat-dog cat

dog
cat

cat-dog

dog
cat@dog.com cat

com

dog
cat

cat@dog.com

com

dog
12/11/2011

(onde o termo é uma data)
12/11/2011

dd20111211
11

12

12/11/2011

2011

dd20111211

Em alguns casos, os novos componentes retornam resultados semelhantes :

Termo Resultados com separador de palavras e lematizador anterior Resultados com novo separador de palavras e lematizador
100$ 100$

nn100$
100$

nn100usd
022 022

nn022
022

nn22
10:49AM

(onde o termo é uma hora)
10:49AM

tt1049
10:49AM

tt24104900

Em alguns casos, os novos componentes retornam menos resultados ou resultados que podem ser inesperados pelos aplicativos:

Termo Resultados com separador de palavras e lematizador anterior Resultados com novo separador de palavras e lematizador
jˊÿqCžl

(onde os termos não são caracteres válidos em inglês)
'jˊÿqCžl' je yq zl
table's table's

tabela
table's
cat- cat

cat-
cat
v-z*(em que v e z são palavras de ruído)* (sem resultados) v-z
$100 000 USD $100

000

nn000

nn100$

usd
$100 000 USD

nn100000usd
beautiful U.S land beautiful

land

u.s

us
beautiful

land
Mt. Kent and Mt Challenger challenger

kent

mt

Mt.
mt

kent

challenger

Alterações de comportamento na pesquisa de Full-Text no SQL Server 2008

No SQL Server 2008 e versões posteriores, o Mecanismo de Full-Text é integrado como um serviço de banco de dados ao banco de dados relacional como parte da infraestrutura do mecanismo de armazenamento e consulta do servidor. A nova arquitetura de pesquisa de texto completo atinge as seguintes metas:

  • Armazenamento integrado e gerenciamento- A pesquisa de texto completo agora é integrada diretamente aos recursos inerentes de armazenamento e gerenciamento de SQL Server e o serviço MSFTESQL não existe mais.

    • Os índices de texto completo são armazenados nos grupos de arquivos de banco de dados, e não no sistema de arquivos. As operações administrativas executadas em um banco de dados, como a criação de um backup, afetam automaticamente seus índices de texto completo.

    • Agora um catálogo de texto completo é um objeto virtual que não pertence a nenhum grupo de arquivos; trata-se de um conceito lógico que faz referência a um grupo de índices de texto completo. Por esse motivo, muitos recursos de gerenciamento de catálogo ficaram obsoletos e isso gerou alterações recentes em alguns recursos. Para obter mais informações, consulte Recursos preteridos do Mecanismo de Banco de Dados no SQL Server 2014 e Alterações interruptivas na Pesquisa de Full-Text.

      Observação

      SQL Server instruções DDL Transact-SQL 2005 que especificam catálogos de texto completo funcionam corretamente.

  • Processamento de consulta integrado– O novo processador de consulta de pesquisa de texto completo faz parte do Mecanismo de Banco de Dados e é totalmente integrado ao processador de consulta SQL Server. Isso significa que o otimizador de consulta reconhece predicados de consulta de texto completo e os executa automaticamente com o máximo de eficácia possível.

  • A pesquisa avançada de administração e solução de problemas de texto completo integrada fornece ferramentas para ajudá-lo a analisar estruturas de pesquisa, como o índice de texto completo, a saída de um determinado separador de palavras, configuração de palavras irrelevantes e assim por diante.

  • As palavras irrelevantes e as listas de palavras irrelevantes (stoplists) substituíram as palavras de ruído o os arquivos de palavras de ruído. Uma lista de palavras irrelevantes é um objeto de banco de dados que facilita as tarefas de capacidade de gerenciamento relacionadas a palavras irrelevantes e melhora a integridade entre diferentes ambientes e instâncias de servidor. Para obter mais informações, veja Configurar e gerenciar palavras irrelevantes e listas de palavras irrelevantes para pesquisa de texto completo.

  • SQL Server 2008 e versões posteriores incluem novos separadores de palavras para muitos dos idiomas que existem no SQL Server 2005. Somente os separadores de palavras para inglês, coreano, tailandês e chinês (todas as formas) permanecem os mesmos. Para outros idiomas, se um catálogo de texto completo foi importado quando um banco de dados SQL Server 2005 foi atualizado para SQL Server 2008 ou uma versão posterior, um ou mais idiomas usados pelos índices de texto completo no catálogo de texto completo agora podem estar associados a novos separadores de palavras que podem se comportar um pouco diferente dos separadores de palavras importados. Para obter mais informações sobre como garantir a consistência entre consultas e o conteúdo do índice de texto completo, consulte Atualizar Full-Text Pesquisa.

  • Um novo serviço Iniciador FDHOST (MSSQLFDLauncher) foi adicionado. Para obter mais informações, consulte Introdução à pesquisa de Full-Text.

  • A indexação de texto completo funciona com uma coluna FILESTREAM da mesma forma que funciona com uma varbinary(max) coluna. A tabela FILESTREAM deve ter uma coluna que contenha a extensão do nome do arquivo para cada BLOB FILESTREAM. Para obter mais informações, consulte Consulta com Full-Text Pesquisar, Configurar e Gerenciar Filtros para Pesquisa e sys.fulltext_document_types (Transact-SQL).

    O mecanismo de texto completo indexa o conteúdo dos BLOBs FILESTREAM. Arquivos de indexação como imagens podem não ser úteis. Quando um BLOB FILESTREAM é atualizado, ele é reindexado.

Consulte Também

Pesquisa de texto completo
Compatibilidade com versões anteriores da pesquisa de texto completo
Atualizar pesquisa de texto completo
Iniciar a pesquisa de texto completo