Улучшение навигации по результатам поиска с помощью уточнений на базе настраиваемых объектов

Исходная статья опубликована в пятницу, 7 декабря 2012 г.

Целевая аудитория: администраторы поиска, ИТ-специалисты.
Необходимые условия: предполагается, что у читателя есть базовые знания об администрировании поиска.

Если требуется облегчить навигацию по результатам поиска, а ваши документы уже имеют метаданные, вы можете включить уточнения, основанные на этих метаданных. Но что делать тогда, когда документы не имеют метаданных, требуемых для уточнения? В этом случае у вас все равно есть способ быстрого сужения результатов поиска и создания уточнений на базе настраиваемых объектов, извлекаемых из содержимого документа.

Предположим, что ваша организация Contoso имеет программу сертификации с несколькими наименованиями сертификации, которые вы хотите использовать для уточнения результатов поиска. Ниже описано, как извлечь эти наименования из основной части и заголовка документов и как создать на их основе уточнения. 

1.       Создайте файл CSV со списком наименований сертификации Contoso и импортируйте этот словарь с помощью командлета PowerShell Import-SPEnterpriseSearchCustomExtractionDictionary.

Ниже приведен пример словаря:

Данный словарь позволяет указать не только то, что следует сопоставить (ключ), но и как следует представить это в уточнении (форма отображения). С помощью формы отображения можно сопоставить разные варианты одного стандартного наименования. В данном примере Contoso Certified Master, Contoso Certified Solutions Master и т. п. отображаются как CCM.

При импорте словаря с помощью Windows PowerShell требуется задать тип средства извлечения настраиваемых объектов. Выбранный тип зависит от того, как вы хотите сопоставить объекты в содержимом. Вы можете произвести сопоставление по словам или их частям как с учетом регистра, так и без него. В данном примере требуется реализовать сопоставление с учетом регистра по целым словам, поэтому можно выбрать настраиваемое извлечение слов, указав Microsoft.UserDictionaries.EntityExtraction.Custom.Word.1 в командлете Windows PowerShell. Если содержимое написано на языке, где разделение пробелами не используется (например, на японском), рекомендуется осуществлять сопоставление по частям слов.

2.       Реализуйте извлечение настраиваемых объектов для содержимого документов.

перейдите к схеме поиска и настройте управляемые свойства body и title, включив тип средства извлечения настраиваемых объектов, который хотите реализовать. Этот тип должен совпадать с типом, указанным при импорте словаря в шаге 1.  

В данном примере включается Word Extraction — Custom1, так как в шаге 1 был импортирован словарь этого типа:

3.       Выполните обход контента коллекции документов.

После импорта словаря и включения извлечения настраиваемых объектов для одного или нескольких управляемых свойств требуется выполнить полный обход контента.

4.       Включите новое уточнение сертификации Contoso.

Измените веб-часть уточнения на странице результатов поиска, чтобы включить настраиваемое уточнение.

 

Готово! Теперь страница результатов поиска содержит уточнения, основанные на средствах извлечения настраиваемых объектов:

 

 

Дополнительные сведения см. в документации по адресу https://technet.microsoft.com/library/jj219480.

Это локализованная запись блога. Оригинал находится на странице Improve navigation through search results using refiners based on custom entities