Общие сведения о корреляции предупреждений

Последнее изменение раздела: 2015-03-09

Основа пакета управления мониторингом Microsoft Exchange Server 2010 — обработчик корреляции. Модуль корреляции был создан, чтобы снизить число оповещений, создаваемых пакетом управления.

В пакете управления Exchange 2007 оповещения всегда создаются, если состояние монитора меняется с зеленого на красное. Этот вид оповещений отключен в пакете управления Exchange Server 2010. Вместо этого оповещения обрабатывает модуль корреляции. Он обрабатывает данные от мониторов пакета управления, определяя, следует ли создавать оповещение. Модуль корреляции помогает администратору, наблюдающему за средой Exchange, сосредоточиться на оповещениях, на которые требуется отреагировать.

Архитектура

Модуль корреляции — это изолированная служба Windows, использующая интерфейс SDK Operations Manager для получения модели работоспособности (или пространства экземпляров) и последующей обработки событий изменения состояния. Поддерживая модель работоспособности в памяти и обрабатывая события изменения состояния, модуль корреляции определяет по состоянию системы, когда следует создавать предупреждения.

Модуль корреляции

На схеме можно видеть, что при возникновении проблемы меняется состояние сразу нескольких мониторов, и соответствующие события изменения состояния передаются агентом корневому серверу управления. После передачи на сервер они обрабатываются обработчиком корреляции, который может породить предупреждение через интерфейс пакета SDK корневого сервера управления. Затем это предупреждение отображается в консоли Operations Manager.

Классификация предупреждений

Предупреждения в пакете управления мониторингом Exchange Server 2010 делятся на три категории. Чтобы ознакомиться с их классификацией, просмотрите следующие определения.

  • Ключевой индикатор работоспособности. Эти индикаторы отражают проблемы, влияющие на работоспособность службы. Большинство предупреждений попадает именно в эту категорию (например, «Отключена база данных почтовых ящиков»).

  • Не влияющие на службу. Эти мониторы выявляют проблемы, которые могут затрагивать отдельных пользователей, но не всех пользователей системы в целом. Хороший пример подобной ситуации — случай, когда два пользователя используют один и тот же прокси-адрес. Почта, отправляемая на этот адрес, будет возвращаться без возможности доставки, но вся система транспорта в целом будет работоспособна.

  • Расследование. Эти мониторы используются для записи сведений, которые могут пригодиться при устранении неполадок, но необязательно свидетельствуют о приближающемся или наступившем сбое в системе. Пример подобной ситуации — «Активность ЦП >90% в течение 5 минут»; возможно, какой-то процесс нерационально использует циклы ЦП, или же сервер был перезагружен и в спешном порядке восстанавливает нормальную деятельность системы. Эти мониторы отображаются в поле «Контекст предупреждения» среди свойств предупреждений, а также в анализаторе работоспособности. Предупреждения для этих мониторов не создаются.

ПримечаниеПримечание.
Состояние не обновляется при появлении одиночного предупреждения для монитора расследования. Тем не менее состояние может обновиться по результатам сведения текущих предупреждений мониторов расследования для каждого компонента.

Серьезность предупреждения

Оповещения пакета управления мониторингом Exchange Server 2010 также делятся на категории по их серьезности:

  • Ошибка. Эти оповещения указывают на серьезную проблему, требующую незамедлительной реакции.

  • Предупреждение. Эти оповещения указывают на потенциальные проблемы в будущем.

  • Информационные предупреждения. Этот вид предупреждений не создается в пакете управления Exchange 2010.

Факторы корреляции

Действия модуля корреляции определяются несколькими факторами.

События изменения состояния монитора. Мониторы собирают сведения диагностики из среды Exchange, используя такие источники, как сообщения журнала событий, пороговые значения счетчиков производительности и выходные события задач PowerShell. Мониторы регистрируют события изменения состояния, когда определяют появление или устранение проблемы (то есть, при изменении красного состояния на зеленое или наоборот). Мониторы также регистрируют изменения состояния, если с сервером Exchange не удается связаться или сервер Exchange становится доступен. Наконец, мониторы регистрируют изменения состояния, если сервер Exchange переходит в режим обслуживания или выходит из него. В пакете управления Exchange 2007 оповещения создаются, если состояние монитора меняется с зеленого на красное. В пакете управления Exchange 2010 оповещения не порождаются автоматически при изменении состояния мониторов. Модуль корреляции определяет, следует ли создавать оповещение. Пакет управления Exchange 2010 включает правила оповещения для каждого монитора. Это позволяет обслуживающему персоналу использовать консоль Operations для просмотра свойств всех мониторов в пакете управления. Они могут создавать особые примечания к мониторам в поле База знаний компании, даже если монитор не создает оповещений.

Модель работоспособности. Вместе с пакетом управления Exchange 2010 в Operations Manager импортируется обширная иерархия классов, определяющих взаимозависимость компонентов системы. Определение этих зависимостей помогает пакету управления Exchange 2010 оценить работоспособность организации Exchange. Например, если пакет управления Exchange 2010 обнаружит, что Служба каталогов Active Directory недоступна, то он сообщит, что обмен сообщениями в Exchange работоспособен лишь частично.

Время. Модуль корреляции работает с 90-секундными интервалами. При одновременном поступлении событий изменения состояния от нескольких мониторов модуль корреляции будет ждать появления других событий, связанных со сбоем, чтобы принять оптимальное решение относительно основной причины.

Алгоритм корреляции

Обзор процесса работы модуля корреляции

  1. Модуль корреляции подключается к службе пакета SDK Operations Manager, чтобы загрузить иерархию модели работоспособности и состояния экземпляров. Это происходит только при запуске службы или в случае, если какие-то ошибки требуют этого.

  2. Затем модуль корреляции запрашивает в Operations Manager последние события изменения состояний, касающиеся объектов из пакета управления Exchange.

  3. При обнаружении новых изменений состояния, не влияющих на службу, модуль корреляции создает для них оповещения.

  4. Модуль корреляции изолирует данные всех мониторов ключевых индикаторов работоспособности в красном состоянии. Модуль корреляции объединяет данные в логические группы, соотносящие каждый процесс с теми, от которых он зависит и которые зависят от него. Эти группы обычно называются цепочками ключевых индикаторов работоспособности. Каждая цепочка указывает на наличие сбоев в схеме взаимозависимостей, влияющих на зависимые процессы.

  5. Модуль корреляции создает оповещение для каждой такой цепочки. Каждое оповещение, создаваемое модулем, указывает на корневую причину проблемы.

  6. После этого модуль корреляции выжидает 90 секунд и продолжает работу с шага 2.

Дополнительная информация о процессе модуля корреляции

  • Если цепочка мониторов ключевых индикаторов работоспособности содержит мониторы как в состоянии ошибки, так и мониторы в состоянии предупреждения, то вне зависимости от класса исходного монитора создается оповещение об ошибке. Например, если в процессе верхнего уровня определен монитор ошибок, выявляющий сбои и коррелирующий с монитором предупреждений в цепочке зависимости, то для зависимости будет создано оповещение. При этом помечено оно будет как ошибка, а не как простое предупреждение.

  • Для корреляции предупреждений используются не все связи между классами. Сведения о конкретных связях, учитываемых модулем корреляции, см. в разделе Приложение. Иерархия классов далее в этом руководстве.

  • Цепочка мониторов ключевых индикаторов работоспособности (включая и мониторы расследования) доступна в поле Контекст предупреждения в свойствах итогового оповещения. Это позволяет администратору просматривать мониторы, коррелирующие с оповещением. Оповещения, создаваемые в зависимых мониторах, следует просматривать для определения конкретного сбоя, на которые указывает оповещение.

Что затрагивается и не затрагивается корреляцией оповещений

Важно понимать, что затрагивает и что не затрагивает работа модуля корреляции.

Следующие аспекты работы пакета управления Exchange 2010 остаются без изменений:

  • Мониторы настраиваются так, чтобы оповещения не создавались автоматически при событиях изменения состояния. Модуль корреляции способен определить оптимальное оповещение, которое следует создать.

  • Пакет управления Exchange 2010 не создает предупреждения о работоспособности вашей среды Exchange, когда остановлен обработчик корреляций. Если обработчик корреляций остановлен, создается общее предупреждение, оповещающее о том, что обработчик корреляций не запущен.

Следующие аспекты работы пакета управления остаются без изменений:

  • Переопределения работают как обычно. Изменять значения и отключать мониторы можно так же, как и всегда.

  • Мониторы и объекты в режиме обслуживания пропускаются модулем корреляции. Рассматривать их отдельно не требуется, так как они не порождают события изменения состояний, пригодные для модуля корреляции.

  • Наличие модуля корреляции не влияет на другие пакеты управления.

Рабочие заметки

Модуль корреляции должен поддерживать в памяти пространство экземпляров группы управления для определения связанных мониторов и предупреждений. Соответственно, объем занимаемой им памяти зависит от числа серверов и баз данных Exchange.

Модулю корреляции требуется приблизительно 5 МБ памяти на отслеживаемый сервер Exchange. Существуют факторы, способные увеличить или уменьшить этот показатель, но его все равно можно использовать в качестве надежной отправной точки при оценке требований к ресурсам сервера, на котором будет размещаться эта служба.

Автоматический сброс мониторов событий в пакете управления Exchange 2010

Значения большинства мониторов событий в пакете управления Exchange 2010 автоматически сбрасываются модулем корреляций. Функция автоматического сброса, добавленная в эти мониторы событий, позволяет отслеживать проблемы при их последующих появлениях. Список мониторов событий, значения которых не сбрасываются автоматически, см. в следующей таблице.

Имя монитора

Во время загрузки сведений о конфигурации агента ведения журнала произошла ошибка.

Сообщения остаются в очереди доставки из-за сбоя.

Конфигурация службы автообнаружения небезопасна. Чтобы устранить эту проблему, отключите анонимный доступ к виртуальному каталогу автообнаружения.

Exchange не удается создать каталог файлов журнала. Файлы журнала не будут создаваться, пока причина сбоя не будет устранена. Причина ошибки и исходный компонент указаны в описании данного события.

Exchange не удается создать новый файл журнала. Файлы журнала не будут создаваться, пока причина сбоя не будет устранена. Причина ошибки и исходный компонент указаны в описании данного события.

Доступные только для чтения файлы были найдены в каталоге раскладки.

Служба транспорта Microsoft Exchange обнаружила критическую ошибку хранилища и провела автоматическое восстановление, переместив базу данных.

Служба рассылки файлов: Не удалось создать дескриптор безопасности из Служба каталогов Active Directory для автономной адресной книги.

Предупреждение анализатора соответствия рекомендациям для Exchange.

Ошибка анализатора соответствия рекомендациям для Exchange.

Не удается переместить почтовый ящик.

Библиотека DsProxy DLL необходима, но ее не удалось загрузить.

Не удается инициализировать счетчики производительности для прокси-интерфейса NSPI.

В локальной копии базы данных поврежден индекс. Повторите заполнение каталога, используя командлет Update-MailboxDatabaseCopy с параметром -CatalogOnly.

Не удается загрузить счетчики производительности для службы отправки почты Microsoft Exchange. Соответствующий объект производительности называется MSExchangeMail Submission.

Сервер локальной топологии не принадлежит ни к какому из сайтов Служба каталогов Active Directory.

В службе отправки почты Microsoft произошло исключение при попытке загрузить сведения о топологии сети.

При обнаружении топологии Exchange не найден локальный сервер Exchange в Служба каталогов Active Directory.

Сообщения остаются в очереди отправки из-за сбоя.

В копии базы данных произошла серьезная ошибка с потерей очистки, которая могла затронуть все копии этой базы данных.

В активной копии базы данных произошла серьезная ошибка с потерей очистки, которая могла затронуть все копии этой базы данных.

В локальной копии базы данных произошла серьезная ошибка с потерей очистки, которая могла затронуть все копии этой базы данных.

Ядро СУБД потребляет 99 % ресурса "Б-деревья" в базе данных (использовано 87048 из максимального количества 87696).

Не удалось удалить файлы добавочного повторного заполнения копии базы данных.

Не удалось удалить файлы непрерывной репликации для копии базы данных.

Процесс восстановления одиночной страницы начал исправление ошибки в копии базы данных.

Процесс восстановления одиночной страницы успешно исправил ошибку в копии базы данных.

Не удалось удалить файл журнала для базы данных. Файл уже используется или служба не имеет необходимых разрешений.

Заданное значение интервала корреляции меньше допустимого минимума.

Заданное значение временного периода корреляции меньше допустимого минимума.