Alterações de comportamento na pesquisa de texto completo
Este tópico descreve alterações de comportamento em pesquisa de texto completo. As alterações de comportamento afetam como os recursos funcionam ou interagem no SQL Server 2014 em comparação com versões anteriores do SQL Server.
Alterações de comportamento na pesquisa de Full-Text no SQL Server 2014
Informações que virão posteriormente.
Alterações de comportamento na pesquisa de Full-Text no SQL Server 2012
SQL Server 2012 instala uma nova versão dos separadores de palavras e lematizadores para inglês dos EUA (LCID 1033) e inglês do Reino Unido (LCID 2057). Porém, você poderá alternar para a versão anterior desses componentes se desejar reter o comportamento anterior. Para obter mais informações, consulte Alterar o separador de palavras usado para inglês (EUA) e inglês (Reino Unido).
Novos separadores de palavras e lematizadores instalados
SQL Server 2012 atualiza todos os separadores de palavras e lematizadores usados pelo Full-Text Pesquisa e Pesquisa Semântica. Para obter consistência entre o conteúdo de índices e os resultados das consultas, nós recomendamos que você repopule os índices de texto completo existentes.
Há novos separadores de palavras para inglês. Se você tiver que manter o comportamento anterior, consulte Change the Word Breaker Used for US English and UK English.
Os separadores de palavras de terceiros para dinamarquês, polonês e turco que foram incluídos em versões anteriores de SQL Server foram substituídos por componentes da Microsoft. Os novos componentes estão habilitados por padrão.
Há novos separadores de palavras para tcheco e grego. Versões anteriores do SQL Server Full-Text Search não incluíram suporte para esses dois idiomas.
Alterações de comportamento de novos separadores de palavras e lematizadores
Os novos componentes podem retornar resultados diferentes dos componentes mais antigos quando você popula e consulta índices de texto completo. As tabelas a seguir demonstram algumas das diferenças que podem ser esperadas em resultados em inglês.
Se você tiver que reter o comportamento anterior dos separadores de palavras e lematizadores, consulte os tópicos seguintes:
Alterar o separador de palavras usado para inglês (EUA) e inglês (Reino Unido)
Reverter os separadores de palavras usados por pesquisa à versão anterior
Em alguns casos, os novos componentes retornam mais resultados:
Termo | Resultados com separador de palavras e lematizador anterior | Resultados com novo separador de palavras e lematizador |
---|---|---|
cat-dog | cat dog |
cat cat-dog dog |
cat@dog.com | cat com dog |
cat cat@dog.com com dog |
12/11/2011 (onde o termo é uma data) |
12/11/2011 dd20111211 |
11 12 12/11/2011 2011 dd20111211 |
Em alguns casos, os novos componentes retornam resultados semelhantes :
Termo | Resultados com separador de palavras e lematizador anterior | Resultados com novo separador de palavras e lematizador |
---|---|---|
100$ | 100$ nn100$ |
100$ nn100usd |
022 | 022 nn022 |
022 nn22 |
10:49AM (onde o termo é uma hora) |
10:49AM tt1049 |
10:49AM tt24104900 |
Em alguns casos, os novos componentes retornam menos resultados ou resultados que podem ser inesperados pelos aplicativos:
Termo | Resultados com separador de palavras e lematizador anterior | Resultados com novo separador de palavras e lematizador |
---|---|---|
jˊÿqCžl (onde os termos não são caracteres válidos em inglês) |
'jˊÿqCžl' | je yq zl |
table's | table's tabela |
table's |
cat- | cat cat- |
cat |
v-z*(em que v e z são palavras de ruído)* | (sem resultados) | v-z |
$100 000 USD | $100 000 nn000 nn100$ usd |
$100 000 USD nn100000usd |
beautiful U.S land | beautiful land u.s us |
beautiful land |
Mt. Kent and Mt Challenger | challenger kent mt Mt. |
mt kent challenger |
Alterações de comportamento na pesquisa de Full-Text no SQL Server 2008
No SQL Server 2008 e versões posteriores, o Mecanismo de Full-Text é integrado como um serviço de banco de dados ao banco de dados relacional como parte da infraestrutura do mecanismo de armazenamento e consulta do servidor. A nova arquitetura de pesquisa de texto completo atinge as seguintes metas:
Armazenamento integrado e gerenciamento- A pesquisa de texto completo agora é integrada diretamente aos recursos inerentes de armazenamento e gerenciamento de SQL Server e o serviço MSFTESQL não existe mais.
Os índices de texto completo são armazenados nos grupos de arquivos de banco de dados, e não no sistema de arquivos. As operações administrativas executadas em um banco de dados, como a criação de um backup, afetam automaticamente seus índices de texto completo.
Agora um catálogo de texto completo é um objeto virtual que não pertence a nenhum grupo de arquivos; trata-se de um conceito lógico que faz referência a um grupo de índices de texto completo. Por esse motivo, muitos recursos de gerenciamento de catálogo ficaram obsoletos e isso gerou alterações recentes em alguns recursos. Para obter mais informações, consulte Recursos preteridos do Mecanismo de Banco de Dados no SQL Server 2014 e Alterações interruptivas na Pesquisa de Full-Text.
Observação
SQL Server instruções DDL Transact-SQL 2005 que especificam catálogos de texto completo funcionam corretamente.
Processamento de consulta integrado– O novo processador de consulta de pesquisa de texto completo faz parte do Mecanismo de Banco de Dados e é totalmente integrado ao processador de consulta SQL Server. Isso significa que o otimizador de consulta reconhece predicados de consulta de texto completo e os executa automaticamente com o máximo de eficácia possível.
A pesquisa avançada de administração e solução de problemas de texto completo integrada fornece ferramentas para ajudá-lo a analisar estruturas de pesquisa, como o índice de texto completo, a saída de um determinado separador de palavras, configuração de palavras irrelevantes e assim por diante.
As palavras irrelevantes e as listas de palavras irrelevantes (stoplists) substituíram as palavras de ruído o os arquivos de palavras de ruído. Uma lista de palavras irrelevantes é um objeto de banco de dados que facilita as tarefas de capacidade de gerenciamento relacionadas a palavras irrelevantes e melhora a integridade entre diferentes ambientes e instâncias de servidor. Para obter mais informações, veja Configurar e gerenciar palavras irrelevantes e listas de palavras irrelevantes para pesquisa de texto completo.
SQL Server 2008 e versões posteriores incluem novos separadores de palavras para muitos dos idiomas que existem no SQL Server 2005. Somente os separadores de palavras para inglês, coreano, tailandês e chinês (todas as formas) permanecem os mesmos. Para outros idiomas, se um catálogo de texto completo foi importado quando um banco de dados SQL Server 2005 foi atualizado para SQL Server 2008 ou uma versão posterior, um ou mais idiomas usados pelos índices de texto completo no catálogo de texto completo agora podem estar associados a novos separadores de palavras que podem se comportar um pouco diferente dos separadores de palavras importados. Para obter mais informações sobre como garantir a consistência entre consultas e o conteúdo do índice de texto completo, consulte Atualizar Full-Text Pesquisa.
Um novo serviço Iniciador FDHOST (MSSQLFDLauncher) foi adicionado. Para obter mais informações, consulte Introdução à pesquisa de Full-Text.
A indexação de texto completo funciona com uma coluna FILESTREAM da mesma forma que funciona com uma
varbinary(max)
coluna. A tabela FILESTREAM deve ter uma coluna que contenha a extensão do nome do arquivo para cada BLOB FILESTREAM. Para obter mais informações, consulte Consulta com Full-Text Pesquisar, Configurar e Gerenciar Filtros para Pesquisa e sys.fulltext_document_types (Transact-SQL).O mecanismo de texto completo indexa o conteúdo dos BLOBs FILESTREAM. Arquivos de indexação como imagens podem não ser úteis. Quando um BLOB FILESTREAM é atualizado, ele é reindexado.
Consulte Também
Pesquisa de texto completo
Compatibilidade com versões anteriores da pesquisa de texto completo
Atualizar pesquisa de texto completo
Iniciar a pesquisa de texto completo