Настройка и оптимизация производительности (полнотекстовый Full-Text Search)

Статья
12/15/2008

Изменения: 14 апреля 2006 г.

На выполнение полнотекстового индексирования и полнотекстовых запросов влияют ресурсы оборудования, например объем памяти, производительность жесткого диска и ЦП.

Производительность полнотекстового индексирования

Основной причиной снижения производительности полнотекстового индексирования является ограничение ресурсов оборудования.

Если загрузка ЦП при работе службы MSFTESQL и SQL Server близка к 100 процентам, значит, узким местом является процессор.
Если средняя длина очереди ожидания обращения к жесткому диску в два или больше раз превышает количество головок диска, значит, узким местом является жесткий диск. Основным решением в этом случае является создание полнотекстовых каталогов, размещенных отдельно от файлов баз данных и журналов SQL Server. Разместите журналы, файлы баз данных и полнотекстовые каталоги на разных дисках. Кроме того, для повышения производительности индексирования можно приобрести более быстрый жесткий диск либо диск с поддержкой RAID.
При нехватке физической памяти (предел в 3 ГБ) и появлении в журнале сканирования сообщения о приостановке службы узким местом является память. Сведения об устранении этой проблемы см. в разделе Приостановка службы полнотекстового поиска (Microsoft) для SQL Server (MSFTESQL). Служба MSFTESQL не поддерживает AWE. Может помочь установка более 4 ГБ памяти SQL Server.

Если в системе отсутствуют узкие места оборудования, можно попробовать выполнить тонкую настройку системы для оптимизации производительности оборудования. Если узкие места оборудования отсутствуют, производительность полнотекстового поиска в Microsoft SQL Server 2005 зависит в основном от:

времени, которое требуется SQL Server для создания полнотекстовых пакетов.
скорости, с которой служба MSFTESQL может обрабатывать эти пакеты.

Оптимальной производительности можно достичь путем настройки взаимодействия SQL Server со службой MSFTESQL. Если SQL Server создает больше пакетов, чем может обработать служба MSFTESQL, то служба приостанавливает работу и формирует сообщение журнала сканирования, сигнализирующее о приостановке. Сведения об устранении этой проблемы см. в разделе Приостановка службы полнотекстового поиска (Microsoft) для SQL Server (MSFTESQL).

С другой стороны, если SQL Server создает недостаточно полнотекстовых пакетов для загрузки службы MSFTESQL, то служба простаивает, что также нежелательно. Данный режим не является оптимальным. На практике это является основной причиной медленного выполнения индексирования. Чтобы обеспечить оптимальную загрузку службы MSFTESQL, необходимо отслеживать и настраивать следующие счетчики:

Пакеты в счетчике состояния — управляющая программа фильтрации для полнотекстового поиска (Microsoft) (MSFTELFD).
Этот счетчик должен быть либо равным количеству ЦП в системе, либо превосходить количество ЦП в два раза. Значения 0, 1 или 2 с низким использованием ЦП означают низкую производительность SQL Server. Например, если в системе используется 4 процессора, этот счетчик должен иметь значение от 4 до 8.
Пакеты в очереди — служба MSFTESQL.

Это значение должно быть близким к количеству диапазонов сканирования, умноженному на 10. Чтобы определить, сколько диапазонов используется для индексирования таблицы, выполните запрос к таблице sys.dm_fts_population_ranges.

Если значение счетчика слишком мало, его можно увеличить следующими способами:

Убедитесь, что для таблицы установлено несколько диапазонов сканирования. Для этого обратитесь с запросом к таблице sys.dm_fts_population_ranges. В идеале количество диапазонов сканирования должно быть в два раза больше количества ЦП. Диапазон сканирования ограничен количеством строк в таблице, количеством ЦП и параметром конфигурации max full-text crawl range. Чтобы изменение параметра max full-text crawl range вступило в силу, необходимо перезапустить процесс сканирования.

Примечание.

Это относится только к полному сканированию.
Убедитесь, что для базовой таблицы установлен кластеризованный индекс. Первый столбец кластеризованного индекса должен иметь целочисленный тип данных. Старайтесь не использовать идентификатор GUID в качестве первого столбца кластеризованного индекса. Мультидиапазонное сканирование кластеризованного индекса может обеспечить наивысшую скорость сканирования.
Обновите статистику базовой таблицы с помощью инструкции UPDATE STATISTICS. Еще важнее обновить статистику кластеризованного индекса или полнотекстового ключа для полного сканирования. Это позволяет при мультидиапазонном сканировании создать в таблице хорошие секции.
Создайте вторичный индекс по столбцу временных меток, если нужно повысить производительность добавочного заполнения.

Примечание.
Это относится только к полному сканированию.

Примечание.
В отличие от сканирования, добавочное, ручное и автоматическое заполнение отслеживания изменений не рассчитаны на максимизацию возможностей ресурсов оборудования с целью повышения скорости их работы. Поэтому данные предложения по настройке могут не дать результата в виде повышения производительности полнотекстового индексирования.

В отличие от сканирования, добавочное, ручное и автоматическое заполнение отслеживания изменений не рассчитаны на максимизацию возможностей ресурсов оборудования с целью повышения скорости их работы. Поэтому данные предложения по настройке могут не дать результата в виде повышения производительности полнотекстового индексирования.

См. также

Основные понятия

Администрирование компонента Full-Text Search

Справка и поддержка

Получение помощи по SQL Server 2005

Журнал изменений

Версия	Журнал
14 апреля 2006 г.	Измененное содержимое Существенно переработаны предложения по настройке производительности.

Поделиться через