Panoramica dello schema di ricerca in SharePoint Server

SI APPLICA A:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

L'indice di ricerca rappresenta il cuore della funzione di ricerca. Il contenuto dell'indice determina le informazioni che gli utenti troveranno in risposta alle query di ricerca immesse o durante l'interazione con le pagine Internet o Intranet.

In questo articolo viene descritto in quale modo l'utilizzo di uno schema di ricerca consente di raccogliere contenuto nell'indice di ricerca e di recuperare tale contenuto dall'indice stesso. Lo schema di ricerca contiene le proprietà sottoposte a ricerca per indicizzazione, le categorie di tali proprietà, il mapping delle proprietà sottoposte a ricerca per indicizzazione alle proprietà gestite e le impostazioni delle proprietà gestite. Le impostazioni delle proprietà gestite determinano l'oggetto e la modalità della ricerca, ad esempio se è possibile affinare la ricerca o eseguire query su una proprietà.

Ricerca per indicizzazione e proprietà sottoposte a ricerca per indicizzazione

Per generare l'indice di ricerca, è innanzitutto necessario effettuare una ricerca per indicizzazione del contenuto. È possibile effettuare una ricerca per indicizzazione di origini contenuto, ad esempio contenuto, condivisioni file o profili utente SharePoint Server. I contenuti e i metadati degli elementi sottoposti a ricerca per indicizzazione sono rappresentati come proprietà sottoposte a ricerca per indicizzazione.

A ogni elemento sottoposto a ricerca per indicizzazione e passato al componente di elaborazione dei contenuti sono associate proprietà sottoposte a ricerca per indicizzazione. Esempi di proprietà sono Author, Title e Creation Date. Ogni nuova proprietà sottoposta a ricerca per indicizzazione viene individuata automaticamente.

Le proprietà sottoposte a ricerca per indicizzazione vengono raggruppate in categorie basate su IFilter o sul gestore di protocollo dell'elemento. Categorie di esempio sono Office (proprietà sottoposte a ricerca per indicizzazione da documenti di Word, fogli di lavoro di Excel e così via), Business Data (proprietà sottoposte a ricerca per indicizzazione da database di esempio) e Web (proprietà sottoposte a ricerca per indicizzazione da siti Web).

Per ulteriori informazioni, vedere Pianificare la ricerca per indicizzazione e la federazione in SharePoint Server.

Proprietà gestite e mapping delle proprietà

Per includere nell'indice di ricerca contenuti e metadati di proprietà sottoposte a ricerca per indicizzazione, è necessario eseguire il mapping delle proprietà sottoposte a ricerca per indicizzazione a proprietà gestite. Solo queste ultime vengono scritte nell'indice di ricerca.

Le proprietà gestite possono avere molte impostazioni. Le impostazioni delle proprietà gestite determinano la modalità di visualizzazione dei contenuti all'interno dei risultati di ricerca e le modalità di ricerca possibili.

È possibile eseguire il mapping di più proprietà sottoposte a ricerca per indicizzazione a una singola proprietà gestita. Ad esempio, è possibile eseguire il mapping delle proprietà sottoposte a ricerca per indicizzazione "Writer" e "Author" alla proprietà gestita "Author". In alternativa, è possibile eseguire il mapping di una singola proprietà sottoposta a ricerca per indicizzazione a più proprietà gestite.

Inoltre, l'ordine in cui le proprietà sottoposte a ricerca per indicizzazione vengono mappate a una proprietà gestita può determinare il contenuto della proprietà stessa. Ad esempio, a una proprietà gestita possono essere mappate più proprietà sottoposte a ricerca per indicizzazione e tale proprietà può essere impostata in modo da includere tutti i valori delle proprietà sottoposte a ricerca per indicizzazione mappate a essa. Tuttavia, se alla proprietà sottoposta a ricerca per indicizzazione contenente il titolo di SharePoint viene attribuita priorità rispetto a un altro titolo nel mapping, nei risultati della ricerca verrà visualizzato il titolo di SharePoint.

È stato definito un set di mapping predefiniti tra le proprietà sottoposte a ricerca per indicizzazione e gestite, vedere Panoramica delle proprietà sottoposte a ricerca per indicizzazione e gestite in SharePoint Server.

Alcuni tipi di proprietà sottoposte a ricerca per indicizzazione generano automaticamente una nuova proprietà gestita e un mapping a quest'ultima della proprietà di origine. Tutte le colonne sito delle raccolte SharePoint, ad esempio, dispongono di questa funzione automatica di generazione e creazione di mapping. Quando si crea una colonna sito in un elenco e si effettua la ricerca per indicizzazione dell'elenco, per tale colonna vengono create una proprietà sottoposta a ricerca per indicizzazione e una proprietà gestita e viene eseguito il mapping tra queste due proprietà.

È possibile modificare il mapping predefinito o qualsiasi altro mapping di proprietà sottoposte a ricerca per indicizzazione a proprietà gestite, eseguire nuovi mapping o creare nuove proprietà gestite. Quando si crea una nuova proprietà gestita o si modificano alcune impostazioni di una proprietà gestita esistente, per includere la proprietà gestita nell'indice di ricerca con il valore corrispondente è necessario effettuare una ricerca per indicizzazione completa. Se la proprietà nuova o modificata si trova in una raccolta o in un elenco di SharePoint, è necessario reindicizzare la raccolta o l'elenco senza avviare una ricerca per indicizzazione completa dell'intera origine di contenuto di SharePoint. Questa operazione equivale a una ricerca per indicizzazione completa.

Vedere la tabella Panoramica delle impostazioni delle proprietà gestite più avanti in questo articolo per maggiori informazioni.

Schema di ricerca

Lo schema di ricerca viene archiviato nel database di amministrazione della ricerca. Lo schema di ricerca contiene:

  • Il mapping tra le proprietà sottoposte a ricerca per indicizzazione e le proprietà gestite. Può trattarsi di un mapping da una proprietà sottoposta a ricerca per indicizzazione a una proprietà gestita, da una a molte, da molte a una o persino da molte a molte.

  • Modalità di scrittura delle proprietà gestite nell'indice di ricerca. Ad esempio, in quale indice full-text devono essere scritti i valori delle proprietà gestite e in quale gruppo di peso (contesto).

  • Impostazioni per le diverse proprietà gestite. Ad esempio, se è possibile eseguire ricerche, eseguire query o perfezionare i risultati della ricerca in base a determinate proprietà gestite.

  • Le categorie di proprietà sottoposte a ricerca per indicizzazione che raggruppano le proprietà in base a IFilter o al gestore di protocollo. Se si modifica una categoria di proprietà sottoposte a ricerca per indicizzazione, le modifiche si applicano a tutte le proprietà all'interno della categoria stessa. Questo può influire sulle prestazioni e sulla modalità di salvataggio delle voci nell'indice di ricerca.

Gli aggiornamenti dello schema di ricerca vengono propagati attraverso il sistema di ricerca ogni minuto.

Schemi di ricerca multipli

È possibile creare schemi di ricerca multipli. Lo schema di ricerca principale viene definito nell'applicazione del servizio di ricerca e può essere modificato in Amministrazione centrale. Gli amministratori di raccolte siti e gli amministratori tenant possono modificare lo schema di ricerca per una raccolta siti o un tenant specifico. Ad esempio, l'amministratore di una raccolta siti può personalizzare il contenuto dell'indice di ricerca modificando lo schema di ricerca relativo alla raccolta siti e personalizzare in tal modo le operazioni di ricerca per la raccolta siti. I proprietari dei siti possono visualizzare lo schema di ricerca, ma non modificarlo.

Nota

[!NOTA] Non è possibile visualizzare o modificare lo schema di ricerca della raccolta siti in Amministrazione centrale. Per visualizzare lo schema di ricerca o apportarvi modifiche per una raccolta siti, è necessario utilizzare Amministrazione raccolta siti.

Indice di ricerca

L'indice di ricerca è costituito da un serie di file all'interno di cartelle in un server. Il componente di elaborazione del contenuto elabora gli elementi sottoposti a ricerca per indicizzazione, utilizza lo schema di ricerca per eseguire il mapping di proprietà sottoposte a ricerca per indicizzazione a proprietà gestite e converte queste ultime in un formato che ne consente la scrittura nell'indice di ricerca. Oltre a diversi indici full-text, sono presenti indici di proprietà gestite separati, alcuni per le proprietà contrassegnate come recuperabili, altri per le proprietà contrassegnate come disponibili per query. È inoltre presente un indice separato per i vettori degli attributi, oltre a diversi indici numerici.

Gruppi di aggiornamento degli indici

Ogni volta che un elemento viene modificato, deve essere sottoposto di nuovo a ricerca per indicizzazione e quindi reindicizzato. Per ridurre il carico di reindicizzazione, in SharePoint Server sono disponibili per la prima volta alcuni gruppi di aggiornamento di indice.

  • Default Contiene la maggior parte delle proprietà gestite. Questo gruppo di aggiornamento dell'indice contiene tutte le proprietà gestite che non appartengono ai gruppi di aggiornamento dell'indice Sicurezza, Collegamento, Utilizzo o Persone.

  • Sicurezza Contiene la proprietà gestita Access Control List (ACL) del documento

  • Collegamento Contiene le proprietà gestite relative alla struttura dei collegamenti

  • Utilizzo Contiene le proprietà gestite correlate ai dati relativi all'utilizzo

  • Persone Contiene le proprietà gestite relative alla ricerca di persone

Ogni gruppo di aggiornamento è archiviato in una cartella diversa all'interno dell'indice di ricerca.

Indice full-text

In un indice full-text è incluso tutto il testo delle proprietà gestite disponibili per la ricerca archiviate in tale indice. Ogni indice full-text è suddiviso in gruppi peso, detti anche contesti. I diversi contesti sono correlati all'importanza relativa di una proprietà gestita e questa è una delle caratteristiche utilizzate per calcolare la classificazione per pertinenza totale di un risultato di ricerca. Il numero o ID di un contesto non è importante. L'importanza relativa è determinata dal modello di classificazione mediante l'assegnazione di un peso di pertinenza a un determinato contesto. Per altre informazioni, vedere la sezione relativa a come Influire sulla classificazione dei risultati della ricerca usando lo schema di ricerca nell'articolo Panoramica della classificazione dei risultati di ricerca in SharePoint Server.

Esistono due indici full-text predefiniti diversi dall'indice full-text predefinito: l'indice full-text Termini di SharePoint ( SpTermsIdx ) e l'indice Persone ( PeopleIdx ).

La maggior parte delle proprietà gestite è già mappata a un contesto e a un indice full-text appropriati per impostazione predefinita. Non è consigliabile cambiare il contesto di alcuna proprietà gestita disponibile per la ricerca esistente.

Panoramica delle impostazioni delle proprietà gestite

Le impostazioni delle proprietà gestite determinano la modalità di salvataggio all'interno dell'indice di ricerca, nonché la possibilità e la modalità di ricerca e recupero del contenuto da parte degli utenti.

È possibile modificare lo schema di ricerca in Amministrazione centrale, Amministrazione raccolta siti e Amministrazione tenant. Gli amministratori dei siti possono visualizzare lo schema di ricerca, ma non possono modificarlo. Nella tabella seguente sono descritte le diverse impostazioni e per ognuna viene indicato se è disponibile per la modifica in corrispondenza di ciascun livello di amministrazione.

Impostazione proprietà gestita Funzione Esempio Disponibile in Ricerca per indicizzazione completa o reindicizzazione dell'elenco o della raccolta di SharePoint necessaria dopo la modifica dell'impostazione
Ricerca consentita Consente di eseguire query nel contenuto della proprietà gestita. Il contenuto della proprietà gestita è incluso nell'indice full-text. Se la proprietà è "author", una ricerca semplice di "Rossi" restituisce gli elementi che contengono la parola "Rossi" e gli elementi la cui proprietà author contiene "Rossi". Amministrazione centrale/Amministrazione raccolta siti/Amministrazione tenant
Impostazioni avanzate ricerca Consente la visualizzazione e la modifica dell'indice full-text in cui è scritta la proprietà gestita. Consente inoltre di modificare il contesto della proprietà gestita per il calcolo della classificazione per pertinenza. Non è consigliabile cambiare il contesto di alcuna proprietà gestita esistente. Per altre informazioni, vedere la sezione relativa a come Influire sulla classificazione dei risultati della ricerca usando lo schema di ricerca nell'articolo Panoramica della classificazione dei risultati di ricerca in SharePoint Server. Amministrazione centrale/Amministrazione raccolta siti/Amministrazione tenant
Sottoponibile a query Consente l'esecuzione di query nella proprietà gestita specifica. È necessario includere nella query il nome della proprietà gestita, indicandolo nella query stessa o inserendovelo a livello di programmazione. Se la proprietà gestita è "author", la query deve contenere "author:Rossi". Amministrazione centrale/Amministrazione raccolta siti/Amministrazione tenant Da disabilitata ad abilitata.
Recuperabile Consente la restituzione del contenuto della proprietà gestita all'interno dei risultati di ricerca. Abilitare questa impostazione per le proprietà gestite pertinenti alla ricerca effettuata. Amministrazione centrale / Amministrazione raccolta siti / Amministrazione tenant Da disabilitata ad abilitata.
Consenti più valori Consente più valori dello stesso tipo nella proprietà gestita. Se la proprietà gestita in questione è "author" e un documento ha più autori, il nome di ciascun autore verrà archiviato come valore separato nella proprietà gestita. Amministrazione centrale
Affinabile Sì - attivo: Consente l'utilizzo della proprietà per affinare i risultati di ricerca nel sistema front-end. È necessario configurare manualmente l'affinamento nella Web part.

Sì - latente: Consente di passare da Affinabile ad Attivo in seguito senza rieseguire una ricerca per indicizzazione completa.

Per rendere effettive entrambe le opzioni è necessario rieffettuare una ricerca per indicizzazione completa.

IMPORTANTE: se si seleziona Sì - attivo o Sì - latente, è inoltre necessario attivare l'impostazione Sottoponibile a query per la proprietà gestita.

Non supportato nell'esperienza di ricerca moderna.
Se la proprietà gestita "author" è impostata su Affinabile, è possibile impostare Author come affinamento nel sistema front-end di ricerca in seguito. Amministrazione centrale Da disabilitata ad abilitata (se non già impostata su Ordinabile)
Ordinabile Sì - attivo: Consente di ordinare il set di risultati in base alla proprietà prima della restituzione del set di risultati stesso.

Sì - latente: Consente di passare da Ordinabile ad Attivo in seguito senza rieseguire una ricerca per indicizzazione completa.

Per rendere effettive entrambe le opzioni è necessario rieffettuare una ricerca per indicizzazione completa.

Non supportato nell'esperienza di ricerca moderna.
Utilizzare per set di risultati di grandi dimensioni che non è possibile ordinare e recuperare nello stesso tempo. Amministrazione centrale Da disabilitata ad abilitata (se non già impostata su Affinabile)
Alias Consente di definire un alias per la proprietà gestita, se si desidera utilizzare l'alias anziché il nome della proprietà gestita all'interno di query e risultati di ricerca. Utilizzare il nome della proprietà gestita originario anziché l'alias per eseguire il mapping a proprietà sottoposte a ricerca per indicizzazione. Utilizzare un alias se non si desidera o non si ha l'autorizzazione per creare una nuova proprietà gestita. Amministrazione centrale/Amministrazione raccolta siti/Amministrazione tenant No
Normalizzazione token Consente il recupero di risultati indipendentemente dall'uso di maiuscole e minuscole e di segni diacritici nella query. La query "curacao" restituirà come risultati "Curaçao", "curacao" e "Curacao". Amministrazione centrale/Amministrazione raccolta siti/Amministrazione tenant
Corrispondenza completa Per impostazione predefinita, la ricerca restituisce corrispondenze parziali tra le query su una proprietà gestita e il contenuto della proprietà gestita.

Selezionare Completa corrispondenza per la ricerca per restituire invece corrispondenze esatte.
Se una proprietà gestita "Title" contiene "Contoso Sites", solo la query Title: "Contoso Sites" fornirà un risultato. Amministrazione centrale/Amministrazione raccolta siti/Amministrazione tenant
Tokenizzazione indipendente dalla lingua (solo SharePoint Server 2019) Selezionare tokenizzazione indipendente dalla lingua se si dispone di contenuto multilingue e la proprietà gestita contiene tag basati su set di termini di metadati o altri identificatori.

Per impostazione predefinita, la ricerca dipende dalla lingua in cui suddivide le query e il contenuto in parti (tokenizzazione). Ad esempio, una raccolta documenti contenente fogli dati di prodotto in inglese e cinese in cui gli identificatori di prodotto hanno caratteri non alfanumerici, ad esempio "11.132-84-115#4". Quando la ricerca elabora un foglio dati, rileva il relativo linguaggio e inserisce in token tutti gli elementi in esso contenuti in base a tale lingua. Quando gli utenti cercano un identificatore di prodotto, la ricerca esegue la tokenizzazione della query in base all'impostazione della lingua del sito di SharePoint in cui si trovano. Se il sito è impostato sull'inglese e l'utente cerca un identificatore di prodotto con token come testo cinese, i token potrebbero non corrispondere e gli utenti non ottengono risultati.

Per migliorare i risultati per gli utenti, eseguire il mapping della proprietà sottoposta a ricerca per indicizzazione per l'identificatore del prodotto a una nuova proprietà gestita, "ProductID", con la tokenizzazione indipendente dalla lingua abilitata. Indicare agli utenti di cercare gli identificatori di prodotto rispetto alla nuova proprietà gestita, come segue: ProductID:"11.132-8".
Se la proprietà sottoposta a ricerca per indicizzazione per un identificatore di prodotto è mappata a una proprietà gestita "ProductID", la ricerca usa la tokenizzazione indipendente dalla lingua per le query su "ProductID". Amministrazione centrale/Amministrazione raccolta siti/Amministrazione tenant
Tokenizzazione di query più fine (solo SharePoint Server 2019) Usare questa impostazione per consentire agli utenti di ottenere risultati di ricerca migliori quando eseguono ricerche in proprietà gestite contenenti metadati con caratteri non alfanumerici. Questa impostazione rallenta le query sulla proprietà gestita.

Gli utenti che preferiscono immettere rapidamente una query e quindi esplorare i risultati per trovare il foglio dati che stanno cercando, in genere immettono query come ProductID:"132-884". Poiché la ricerca per impostazione predefinita suddivide il contenuto dell'indice di ricerca in parti più piccole rispetto alle query, la ricerca potrebbe non trovare corrispondenze per queste query. Quando la query viene sottoposta a token più fine, è più probabile che esistano corrispondenze tra i token nell'indice di ricerca e nella query. Gli utenti possono anche eseguire query per la parte centrale o l'ultima parte dell'identificatore del prodotto.

Gli utenti che cercano un foglio dati e si aspettano di ottenere solo risultati corrispondenti all'identificatore di prodotto completo, in genere scrivono query come ProductID:"11.132-884-115#4". La tokenizzazione di query più fine non fa la differenza per tali query.
Se si dispone di una proprietà gestita "Identificatore prodotto" che contiene "11.132-884-115#4", ricerche come ProductID:"132-884" otterranno probabilmente risultati. Amministrazione centrale/Amministrazione raccolta siti/Amministrazione tenant No
Mapping a proprietà sottoposte a ricerca per indicizzazione L'elenco mostra tutte le proprietà sottoposte a ricerca per indicizzazione per le quali è stato eseguito il mapping alla proprietà gestita in questione. Una proprietà gestita può derivare il contenuto da una o più proprietà sottoposte a ricerca per indicizzazione.

È possibile includere contenuto da tutte le proprietà sottoposte a ricerca per indicizzazione oppure dalla prima proprietà sottoposta a ricerca per indicizzazione non vuota, in base all'ordine specificato.
Amministrazione centrale/Amministrazione raccolta siti/Amministrazione tenant
Estrazione nome società Consente al sistema di estrarre entità nome società dalla proprietà gestita durante la ricerca per indicizzazione di elementi nuovi o aggiornati. Le entità estratte possono essere utilizzate in seguito per l'impostazione di affinamento.

Esiste un dizionario prepopolato per l'estrazione dei nomi della società. Il sistema salva il contenuto della proprietà gestita originale invariato nell'indice e, inoltre, copia le entità estratte nella proprietà gestita "companies". La proprietà gestita "companies" è configurata per essere ricercabile, ricercabile, recuperabile, ordinabile e perfezionabile.

È possibile modificare il dizionario dei nomi delle società nell'archivio termini.

Per altre informazioni, vedere Gestire l'estrazione di nomi di società in SharePoint Server.

Non supportato nell'esperienza di ricerca moderna.
Amministrazione centrale/Amministrazione raccolta siti/Amministrazione tenant
Estrazione entità personalizzata Consente di associare uno o più estrattori di entità personalizzati a questa proprietà gestita. In questo modo il sistema può estrarre entità dalla proprietà gestita durante la ricerca per indicizzazione di elementi nuovi o aggiornati. Le entità estratte possono essere utilizzate in seguito per l'impostazione di affinamento.

Per ulteriori informazioni, vedere Creare e distribuire estrattori di entità personalizzati in SharePoint Server.

Non supportato nell'esperienza di ricerca moderna.
Amministrazione centrale/Amministrazione raccolta siti

Vedere anche

Gestire lo schema di ricerca in SharePoint Online

Panoramica della ricerca per indicizzazione e managed properties in SharePoint Server

Pianificare la ricerca per indicizzazione e la federazione in SharePoint Server