Parole non significative ed elenchi di parole non significative

Per assicurare l'efficienza dell'indice full-text, SQL Server è dotato di un meccanismo che rimuove le stringhe più frequenti, inutili ai fini della ricerca. Queste stringhe scartate vengono denominate parole non significative. Durante la creazione dell'indice, il motore di ricerca full-text omette le parole non significative dall'indice full-text, in modo che le query full-text non eseguano ricerche in tali parole.

Nota importanteImportante

Le parole non significative di SQL Server 2005 sono state sostituite. Quando un database viene aggiornato a SQL Server 2008 da una versione precedente, i file delle parole non significative non vengono più utilizzati in SQL Server 2008. Tali file vengono tuttavia archiviati nella cartella FTDATA\ FTNoiseThesaurusBak e possono essere utilizzati in seguito durante l'aggiornamento o la creazione degli elenchi di parole non significative corrispondenti di SQL Server 2008. Per informazioni sull'aggiornamento dei file delle parole non significative agli elenchi corrispondenti, vedere Aggiornamento della ricerca full-text.

Una parola non significativa può essere una parola con un significato in un linguaggio specifico o può essere un token che non dispone di significato linguistico. Nella lingua italiana, ad esempio, parole quali "circa", "con", "devo" e "cui" vengono escluse dall'indice full-text poiché in pratica risultano inutili ai fini della ricerca.

Anche se ignora l'inclusione di parole non significative, l'indice full-text ne prende in considerazione la posizione. Si consideri ad esempio la frase "Istruzioni non valide per questi modelli Adventure Works Cycles". Nella tabella seguente viene illustrata la posizione delle parole nella frase:

Parola

Posizione

Istruzioni

1

non

2

valide

3

per

4

questi

5

modelli

6

Adventure

7

Works

8

Cycles

9

Le parole non significative "non", "per" e "questi" nelle posizioni 2, 4 e 5 vengono escluse dall'indice full-text. Le relative informazioni di posizione vengono comunque mantenute, lasciando invariata la posizione delle altre parole nella frase.

Elenchi di parole non significative

In SQL Server 2008 le parole non significative vengono gestite nei database utilizzando oggetti denominati elenchi di parole non significative. Un elenco di parole non significative è un elenco che, quando associato a un indice full-text, viene applicato alle query full-text su tale indice.

Creazione di un elenco di parole non significative

È possibile creare un elenco di parole non significative in uno dei modi seguenti:

  • Utilizzando nel database l'elenco di parole non significative di sistema. L'elenco di parole non significative di sistema incluso in SQL Server contiene le parole non significative più comuni per ogni lingua supportata, ovvero per ogni lingua associata a word breaker specifici per impostazione predefinita. L'elenco contiene le parole non significative comuni per tutte le lingue supportate. È possibile copiare l'elenco di parole non significative di sistema e personalizzarne una copia aggiungendone e rimuovendone alcune.

    L'elenco di parole non significative di sistema è installato nel database Risorsa.

  • Creando un elenco di parole non significative personalizzato, quindi aggiungendovi altre parole non significative per ogni lingua specificata. Se necessario, è inoltre possibile eliminare parole non significative dall'elenco.

  • Utilizzando un elenco di parole non significative personalizzato esistente da qualsiasi altro database nell'istanza del server corrente e successivamente aggiungendo ed eliminando le parole non significative in base alle specifiche esigenze.

Nota importanteImportante

CREATE FULLTEXT STOPLIST, ALTER FULLTEXT STOPLIST e DROP FULLTEXT STOPLIST sono supportate solo con il livello di compatibilità 100. Con livelli di compatibilità 80 e 90, queste istruzioni non sono supportate. Con tutti i livelli di compatibilità, tuttavia, l'elenco di parole non significative di sistema viene automaticamente associato ai nuovi indici full-text.

Per creare un elenco di parole non significative

Per aggiungere o eliminare parole non significative in un elenco

Per eliminare un elenco di parole non significative

Utilizzo di un elenco di parole non significative nelle query

Per utilizzare un elenco di parole non significative nelle query, è necessario associarlo a un indice full-text. È possibile associare un elenco di parole non significative a un indice full-text quando si crea l'indice oppure è possibile modificare l'indice in seguito per aggiungere un elenco.

Per creare un indice full-text e associare un elenco di parole non significative

Per associare o annullare l'associazione di un elenco di parole non significative a un indice full-text esistente

Per evitare la visualizzazione di un messaggio di errore se le parole non significative impediscono l'esecuzione di un'operazione booleana in una query full-text

Visualizzazione di elenchi di parole non significative e relativi metadati

Per visualizzare tutte le parole non significative di un elenco

Per ottenere informazioni su tutti gli elenchi di parole non significative nel database corrente

Per visualizzare il risultato della suddivisione in token di una combinazione di word breaker, thesaurus ed elenchi di parole non significative