Устранение неполадок, связанных с серым агента состояний в System Center Operations Manager 2007 и System Center Essentials

Переводы статьи Переводы статьи
Закрыть Закрыть
Код статьи: 2288515 - Vizualiza?i produsele pentru care se aplic? acest articol.
Развернуть все | Свернуть все

Аннотация

Следующая информация описывает устранение неполадок, где агент, сервера или шлюза в System Center Operations Manager 2007 или System Center Essentials 2007 и 2010 находится в состоянии, серый.

Дополнительная информация

Агент, сервера или шлюза может иметь одно из следующих состояний:
Свернуть эту таблицуРазвернуть эту таблицу
СостояниеОписание
Исправен – зеленый флажокАгент управления сервер работает нормально.
Критическое — красный флажокИмеется проблема на сервере агент управления.
Неизвестный – серый агента. Имя агента и флажок затемняется.Отслеживание работоспособности службы корневого сервера управления (RMS), наблюдение за службой работоспособности наблюдаемого компьютера не получает тактовые импульсы от агента больше.  Он их получения ранее (и была обнаружена как Исправен), но теперь это не так. Это также означает, что серверы управления, не получают никакой информации от агента вообще.

Компьютер под управлением агента может быть вниз или могут быть проблемы с подключением. Можно найти дополнительные сведения о представлении работоспособности службы наблюдателя.
Неизвестный – Зеленый круг без галочкиСостояние обнаруженного элемента неизвестен. Монитор не доступна для этого конкретного обнаруженного элемента.

Существует несколько причин для агента или сервер управления или шлюза иметь серый состояния. Некоторые из распространенных причин:

· Сбой проверки соединения

· Недопустимая конфигурация

· Сбой системы рабочих процессов

· Производительность базы данных/DW OpsMgr

· Службы управления правами или основной MS или производительности шлюза

· Проблемы проверки подлинности сети

· Не запущена служба работоспособности

Сначала понять топологии Operations Manager и определение области проблемы до устранения проблемы агента серый, проводимых. Следующие вопросы помогут определить области проблемы.

·  Сколько агентов зависят от него?

·  Возникают ли агенты неполадки в одном сегменте сети?

·  Они сообщают на один и тот же сервер управления?

·  Как часто включить агенты серый цвет и оставаться в этом состоянии?

·  Как можно восстановить из этой ситуации? (например перезапустить службу агента работоспособности, очистить кэш, восстановление выполняется автоматически, и т.д.)

·  Предупреждения сбоев пульса создаются для этих агентов?

·  Таки случилось эту проблему в определенное время суток?

·  Does проблема продолжает возникать, если вас отказоустойчивого эти агенты для другого MS в GTW?

·  Когда запускали эту проблему?

·  Были ли любые изменения группы шлюз серверов управление агентами/управления?

·  Это агентов в вопросе системы Windows в составе кластера?

·  Состояние работоспособности службы папки, исключенные из AV сканирования?

·  — Это среда OpsMgr с пакетом обновления 1 или R2?

Устранение проблемы состояния серого будет диктовки, какой компонент неактивен, где он попадает в топологии и ширину разворота проблема заключается в. Давайте рассмотрим следующие сценарии:

·  Если серым агентов определенного шлюза на управление сервером отчетов затем устранение должна запускаться на уровне сервера шлюза и управления.

·  Если шлюзы, отчетности, управления конкретного сервера недоступны устранения неполадок следует запустите на уровне сервера управления.

·  Для агента меньше систем, сетевые устройства и серверы Unix/Linux устранения неполадок следует начинаются с агент управления сервером/шлюза наблюдения за этими объектами.

·  Если все системы становятся неактивными затем устранения неполадок следует начинается с корневого сервера управления.

Другими словами начните Устранение неполадок на уровне выше компонент, который отображается серым цветом.

Ниже приведены некоторые из распространенных сценариев, которые будут видны.

В сценарии 1:
Есть только несколько агентов, которые используются и они сообщают для управления серверами. Агенты находятся в этом состоянии все время. Очистка кэша помогает агента в разрешении проблемы временно. Однако проблема возвращается через несколько дней.

Разрешение:

В этом случае для решения проблемы могут быть взяты следующие действия:

·         Применение 981263 КБ на уязвимых системах.

·         Исключите из антивирусного сканирования кэша агента.

·         Остановка службы работоспособности

·         Очистить кэш агента

·         Запуск службы работоспособности

Примечание: Лучше заранее KB981263 всех наблюдаемых систем, включая серверы управления и исключить агент управления кэша из антивирусного сканирования для предотвращения таких ситуаций в других системах.

Дополнительная информация приведена в следующих статьях БАЗЫ знаний:

·         Управление серверами или назначенных агентов неожиданно отображаются как недоступные в консоли Operations Manager в Windows Server 2003 или Windows Server 2008: http://support.Microsoft.com/kb/981263

·         Рекомендации по антивирусной исключений, которые связывают Operations Manager 2007 и MOM 2005: http://support.Microsoft.com/kb/975931

Сценарий 2:
Есть только несколько агентов, которые используются и они сообщают для управления серверами. Агенты находятся в этом состоянии все время. Очистка кэша агент не поможет.

Разрешение:

1. После подтверждения работоспособности запущена служба агента. Дальнейшие действия является поиск любого из следующих событий в журнале событий диспетчера операций агента:

КОД события: 1102
Источник события: HealthService
Описание события:
Правила/Monitor под управлением для экземпляра «% 3» с идентификатором «% 4»: «%2» не может быть инициализирован и не будут загружены. Группа управления «% 1»

КОД события: 1103
Источник события: HealthService
Описание события:
Сводка: %2 правил / monitor(s) сбой и got %3 выгружается, они достигнут предел сбоя, который предотвращает автоматическую перезагрузку. Группа управления «% 1». Это событие, только сводки, ознакомьтесь с другими событиями с описаниями выгружен правил / monitor(s).

КОД события: 1104
Источник события: HealthService
Описание события:
Запуск от имени профиля в рабочий процесс «% 4» выполняется для экземпляра «% 3» с идентификатором: «%2» не может быть разрешена. Рабочий процесс не будет загружена. Группа управления «% 1»

КОД события: 1105
Источник события: HealthService
Описание события:
Несоответствие типов профиля RunAs в рабочий процесс «% 4» выполняется для экземпляра «% 3» с идентификатором: «%2». Рабочий процесс не будет загружена. Группа управления «% 1»

КОД события: 1106
Источник события: HealthService
Описание события:
Невозможно получить доступ к профилю RunAs обычного текста в рабочий процесс «% 4», например с «% 3» с идентификатором: «%2». Рабочий процесс не будет загружена. Группа управления «% 1»

КОД события: 1107
Источник события: HealthService
Описание события:
Счет для профиля RunAs в рабочий процесс «% 4», например с «% 3» с идентификатором: «%2» не определен. Рабочий процесс не будет загружена. Свяжите учетную запись с профилем. Группа управления «% 1»

КОД события: 1108
Источник события: HealthService
Описание события:
Не удается определить учетную запись в профиль выполнения от имени «% 7». В частности, учетная запись, используемая в переопределить защитить ссылку «% 6».  % n n %, это условие возможно учетная запись настроена на этот компьютер. Чтобы устранить эту проблему, необходимо открыть профиль выполнения от имени указанного ниже, найдите запись учетной записи согласно его SSID и или выбрать для распространения учетной записи на этом компьютере, если это уместно, или изменения параметра в профиле, таким образом, целевой объект не использует указанную учетную запись.  % n % nManagement группы: %1% nRun как профиль: %7% nSecureReferenceOverride имя: %6% nSecureReferenceOverride ID: %4% nObject имя: %3% nObject ID: %2% nAccount SSID: %5

КОД события: 4000
Источник события: HealthService
Описание события:
Слежение узел не отвечает или испытал.  Код состояния ошибки узла: % 1.

КОД события: 21016
Источник события: Разъем OpsMgr
Описание события:
OpsMgr не удалось установить канал связи с %1, а узлы не перехода на другой ресурс.  Связь продолжится, когда %1 и допускается связь данного компьютера.

КОД события: 21006
Источник события: Разъем OpsMgr
Описание события:
Разъем OpsMgr не удалось подключиться к % 1: % 2.  Код ошибки-% 3(%4).  Убедитесь, что связность сети, сервер работает и зарегистрированного ожидающего порта и нет брандмауэры, блокирование трафика в место назначения.

КОД события: 20070
Источник события: Разъем OpsMgr
Описание события:
Разъем OpsMgr подключен к % 1, но подключение было закрыто сразу после проверки подлинности.  Наиболее вероятной причиной этой ошибки является агент не авторизован для взаимодействия с сервером или сервер не получил конфигурации.  Проверьте журнал событий на сервере на наличие 20000 события, указывающий агентов, которые не утверждены осуществляется подключение.

КОД события: 20051
Источник события: Разъем OpsMgr
Описание события:
Не удалось загрузить указанный сертификат, так как сертификат не подходит.  Проверьте, правильно ли системное время и выдать сертификат, при необходимости % n сертификат допустимое время начала: % 1% n допустимое время окончания сертификата: %2

Источник события: ESE
Категория события: Диспетчер транзакций
КОД события: 623
Описание: HealthService (<pid></pid>) Для экземпляра хранилища версий <instance></instance> ("<name></name>") достиг максимального размера окна <value></value>МБ. Вполне вероятно, что Длительная транзакция препятствует очистки хранилища версий и вызывает ее для построения в размере. Обновления будут отклонены, пока Длительная транзакция полностью фиксации или отката. Возможные длительной транзакции:
Код сеанса: <value></value>
Контекста сеанса: <value></value>
ThreadId контекста сеанса: <value></value>.
Очистка:<value></value>

2. События с кодом 1102 и 1103 показывают некоторые процессы, не удалось загрузить. Если эти процессы ядра системы затем он может привести к проблемы агента серый. Фокус в этом случае необходимо разрешение этих событий. Один из следующих 1104 события 1105, 1106, 1107 и 1108 может привести к код события: событие 1103 и 1102. Это будет обычно из-за неправильно настроенного выполнения как учетные записи. В версии R2 распространенная причина, это происходит обусловлено либо выполнить как учетные записи настроены для использования с неверный класс или не настроен на распределенных агенту.

3. Код события: 4000 указывает, произошел сбой в процессе Monitoringhost.exe. Если несоответствие Dll или отсутствующие разделы реестра затем выдать быстро переустановить агента может устранить проблему. Если это не помогает можно помещению следующих средств:

a. обрабатывают монитора точки процесс аварийно завершает работу)http://TechNet.Microsoft.com/en-US/Sysinternals/bb896645.aspx)

b. Adplus дампа в аварийный режим (http://support.Microsoft.com/kb/286350)

c. Если агент наблюдает за сетевыми устройствами, и он выполняется в системе Windows Server 2003, может потребоваться следующее исправление:

Мониторинг устройств SNMP могут перестать периодически в System Center Operations Manager или в Essentials(KB 982501) центре системы: http://support.Microsoft.com/kb/982501

4. События с кодом 21006 указывает, существуют проблемы связи между агентом и сервером управления. Если агент использует сертификат для проверки подлинности, убедитесь в том, не истек срок действия сертификата; агент использует правильный сертификат или сертификат просрочен. Если используется Kerberos, убедитесь в том, агент может взаимодействовать со службой каталогов Active Directory. Если проверка подлинности работает правильно, может быть пакеты от агента не делая для управления сервером/шлюза. Простые telnet к порту 5723 от агента управления сервером может быть хорошим началом.  Одновременно трассировки сети между агентом и сервером управления при воспроизведении сбоев связи могут помочь в поиске, если пакеты делая мс; Нет устройства между оптимизации трафика и удаления некоторых пакетов не существует. (См. http://support.Microsoft.com/kb/812953/en-US)

5. В другом случае, завис службы работоспособности. Дамп Adplus в режиме зависания может помочь в определении причины зависания. (http://support.Microsoft.com/kb/286350)

6. Код события: 623 обычно возникают в большой среде Operations Manager, в котором компьютер агента или сервер управления управляет многих рабочих процессах. Для получения дополнительной информации и разрешения обратитесь на следующий КБ:

В консоли операций диспетчера Operations Manager 2007 недоступен один или несколько серверов управления и их управляемого устройства:

http://support.Microsoft.com/kb/975057

Сценарий 3:
Все отчеты для одного конкретного управления сервером/шлюза агенты неактивны.

Разрешение:

1. В этом случае первым шагом будет понять, какого рода рабочих нагрузок мониторинг управления сервер или шлюз. Например число сетевых устройств, агенты Cross агенты платформы, Синтетические транзакции и Windows, без использования агента машин.

2. Как и в сценарии 2, убедитесь, что службы работоспособности включен д и запущенных в настоящее время управление сервер или шлюз.

3. Проверьте, если сервер управления помещается в режим обслуживания. Если удалить его из режима обслуживания.

4. Проверьте наличие подобных событий как в сценарии 2. Если вы видите код события: 21006 здесь разница заключается в том, что управления сервером/шлюза не удается установить связь с его родительского сервера. Для MS бы RMS или является шлюзом может быть RMS или г-жа убедитесь в том же вещи, как при выполнении шага 5 в сценарии 2.

5. Помимо приведенных выше Если работоспособности службы является наблюдение за сетевым устройствам и управление сервер работает в системе Windows Server 2003 можно применять следующие исправления:

Мониторинг устройств SNMP могут перестать периодически в System Center Operations Manager или в Essentials(KB 982501) центре системы: http://support.Microsoft.com/kb/982501

6. Найдите следующие события в журнале событий диспетчера операций. Следующие события обычно означают, что существуют проблемы с производительностью на сервере управления или размещения OperationsManager или OperationsManagerDW SQL Server:

КОД события: 2115
Источник события: HealthService
Описание события:
Привязка источника данных в группе управления %1 разнесен элементы в процесс, но не получил ответ в %5 секунд.  Указывает, производительности или функциональные проблемы с workflow.%n идентификатор рабочего процесса: % 2% n экземпляра: % 3% n идентификатор экземпляра: % 4% n

КОД события: 5300
Источник события: HealthService
Описание события:
Неисправен работоспособности локальной службы. Изменение состояния сущности потока останавливается с ожидающих подтверждения.  % n % nManagement группы: %1 %2 nManagement код группы: %1

КОД события: 4506
Источник события: HealthService
Описание события: Диспетчер операций
Данные были отключены из-за слишком много необработанных данных в правило выполняется для экземпляра «% 3» с идентификатором «% 2»: «%4» в управлении группы «% 1».

КОД события: 31551
Источник события: Работоспособности службы модулей
Описание события:
Не удалось сохранить данные в хранилище данных. Операция будет retried.%rException «% 5»: ни один или несколько рабочих процессов были затронуты это %6% n %.   % n % nWorkflow имя: %2% nInstance имя: %3% nInstance ID: %4% nManagement группы: %1

КОД события: 31552
Источник события: Работоспособности службы модулей
Описание события:
Не удалось сохранить данные в Warehouse.%rException данных «% 5»: ни один или несколько рабочих процессов были затронуты это %6% n %.   % n % nWorkflow имя: %2% nInstance имя: %3% nInstance ID: %4% nManagement группы: %1

КОД события: 31553
Источник события: Работоспособности службы модулей
Описание события:
Данные были записаны в хранилище данных промежуточной области, но обработка закончилась неудачно одной из последующих operations.%rException «% 5»: ни один или несколько рабочих процессов были затронуты это %6% n %.   % n % nWorkflow имя: %2% nInstance имя: %3% nInstance ID: %4% nManagement группы: %1

ID:31557 событий
Источник события: Работоспособности службы модулей
Описание события:
Не удалось получить сведения о состоянии процесса синхронизации из базы данных хранилища данных. Операция будет retried.%rException «% 5»: ни один или несколько рабочих процессов были затронуты это %6% n %.   % n % nWorkflow имя: %2% nInstance имя: %3% nInstance ID: %4% nManagement группы: %1

7. Для устранения неполадок производительности сервера или шлюза управления и производительности SQL просмотрите следующие разделы данного документа:

Устранение неполадок производительности сервера или шлюза управления

Устранение неполадок производительности SQL

8. Код события: 3155X можно также войти из-за неправильного Запуск от имени учетной записи конфигурации или отсутствуют разрешения для учетных записей Runas. Просмотрите следующие блог, у него есть лист excel, который выводится список разрешений для различных учетных записей, используемых в OpsMgr.

Учетная запись безопасности OpsMgr права сопоставление - какие учетные записи должны какими правами?
http://blogs.TechNet.com/b/kevinholman/Archive/2008/04/15/OpsMgr-Security-Account-Rights-Mapping-What-Accounts-need-What-Privileges.aspx

Случай 4: Все агенты отчетности одного конкретного управления сервера триггера из серого Исправен и исправен серый состояние периодически.

Случай 5:
Все держать агентам отчетов в среде отражение flopping от серого Исправен и исправен серый состояние периодически.

Разрешение: Некоторые из основных причин для временного состояния серого являются:

·  Родительский сервер агентов временно перешел в автономный режим.

·  Агенты, затопления MS с оперативными данными (предупреждения, обнаружения, район и т.д.) может привести к выше использования ресурсов на серверах OpsMgr и OpsMgr DB

·  Возникли сбои в работе сети, которые ведут ошибок временного подключения между агентами и родительского сервера.

·  Изменения пакета управления в консоли OpsMgr требует конфигурации OpsMgr & перераспределения MP для агентов. Если изменение влияет на базовый размер агента, это может привести к более использования ресурсов на серверах OpsMgr и OpsMgr DB.

Важной информации для этих двух сценариев является понимание: как долго lasted серые состояния и времени суток оно произошло?

Это Справка в перечня проблема быстро и определить процесс устранения неполадок, которые должны быть предприняты.

Устранение неполадок управления сервером/шлюза производительности и производительности SQL просмотрите следующие разделы данного документа:

Устранение неполадок производительности сервера или шлюза управления

Устранение неполадок производительности SQL

Устранение неполадок производительности сервера или шлюза управления:

Корневой сервер управления (RMS):


Конфигурации пакетов обновления вызвано MP imports и обнаружения данных. При низкой производительности системы, узкие места чаще всего два верхних являются, во-первых, ЦП и, второй, диск (OpsMgr установочного диска).

RMS отвечает за создание и отправка файлов конфигурации все уязвимые службы работоспособности.

Для рабочего процесса перезагрузки (вызванные новой конфигурации на RMS), скорее всего, узких мест, опять же, ЦП сначала и второй диск (OpsMgr установочного диска). RMS отвечает за чтение файла конфигурации, загрузки и инициализации всех рабочих процессов на RMS и обновление хранилища RMS HealthService при обновлении файла конфигурации для службы управления правами.

Для пакетов действия локального рабочего процесса (когда агенты изменить их доступность) являются основной узких мест ЦП. Если Процессор не превышен, его могут содержать диск. RMS отвечает за мониторинг доступности всех агентов, с помощью службы управления правами локальных рабочих процессов. RMS также содержит распределенные зависимость мониторами, которые с помощью диска.

Сервер управления (мс):


Во время пакетного обновления конфигурации (за обнаружение и импорт MP) обычно узкие места являются, во-первых, ЦП и, во-вторых, диск (диск установки OpsMgr). MS отвечает пересылки файлов конфигурации службы управления правами агенты целевой.

Для сбора оперативных данных узких мест обычно вызываются ЦП. Также возможно, диск maxed out, но не возможно. MS отвечает для распаковки и расшифровка входящего оперативных данных и вставлять его в рабочей базе данных. Он также отправляет обратно подтверждения (ACK) агентов и шлюзы после получения оперативных данных и диск использует очередь для временного хранения этих исходящее ACK. Наконец, также будет пересылать MS отслеживать изменения состояния (снова с помощью очереди диска) службы управления правами для мониторов распределенных зависимость.

Шлюз (GW):

GW — оба Процессора и ввода-ВЫВОДА привязкой. Когда он ретрансляция большой объем данных, оба эти может показать высокая нагрузка. Большая часть стоимости Процессора из-за использования распаковки, сжатия, шифрования и расшифровки входящие данные вместе с его передачи. Все данные, полученные с GW от агентов, хранятся в постоянные очереди на диске для чтения и пересылаемый HealthService GW мс. Это может привести к большой использования диска. Это может оказаться существенным при GW временно переводится в автономный режим и должен обрабатывать накопленной агента данных, агенты создается и попытался отправить хотя GW находился в автономном режиме.

Информация для сбора каждого влияет управления сервером/шлюза:

· Точное версию Windows, выпуска и построения (то есть Windows Server 2003 Enterprise x 64 с пакетом обновления 2)

· Число процессоров

· Объем оперативной памяти

· Буква диска, содержащего папку состояния работоспособности службы

· Антивирусная программа настроена для исключения хранилище службы работоспособности? Для получения дополнительных сведений просмотрите следующие КБ:
Рекомендации по антивирусной исключений, которые связывают Operations Manager 2007 и MOM 2005: http://support.Microsoft.com/kb/975931

·  Уровень RAID (0, 1, 5, 0 + 1 или 1 + 0) для дисков, используемых службой состояния работоспособности. Количество дисков, используемых для RAID

·  Есть ли на контроллере массива включен кэш записи резервной батареи?

Устранение неполадок производительности SQL:

Рабочие базы данных (OperationsManager):


Для DB чаще всего является узким местом является дискового массива. При условии, что диск не превышен; Далее она скорее является Процессор. Замедление будет DB иногда происходит с оперативными данными "лавины" (очень высокая интенсивность события, оповещения, данные о производительности и/или изменения состояния относительно продолжительный период времени). Короткие ускоренной обычно не приводит все значительные задержки для продолжительного периода времени.

Во время вставки оперативных данных DB диски в первую очередь используются для записи. Использование ЦП обычно происходит из-за степень изменения SQL Server. Это может произойти с больших и сложных запросов, вставки данных в большой и интерьерам большие таблицы (по умолчанию это происходит в полночь). Интерьерам таблиц событий и данных о производительности, даже если они имеют очень большой размер, обычно не является очень дорогостоящим, но интерьерам оповещения и изменение состояния таблицы может быть довольно высоким потреблением ресурсов ЦП, если они когда-нибудь стать очень большими.

DB также будут ЦП при импорте обработку пакетов конфигурации распространения, которая вызвана MP или изменение места огромный экземпляра. Сильно в таких случаях служба настройки запросов DB для новой конфигурации агентов, часто вызывают центрального Процессора возрастает в базе данных до отправки обновлений конфигурации агентов.

Хранилище данных (OperationsManagerDW):

Вероятно, наиболее узким местом является дискового массива. Обычно это вызвано вставок очень больших рабочих данных. В этих случаях диски будут в основном занятости во время операции записи. Как правило не будет много операций чтения, за исключением чтобы обрабатывать вручную созданные представления отчетности, которые выполнять запросы на DW.

Использование ЦП обычно происходит из-за степень изменения SQL Server. Штриховое секционирование активности (когда таблицы стать очень большими и затем получить секционирование), выполнение сложных отчетов и большое количество предупреждений в базе данных (который DW должен постоянно синхронизировать) все привести пиковые значения загрузки ЦП.

Информация для сбора каждого влияет на сервер базы данных SQL:

·  Именно ту версию, выпуск и построения SQL (то есть SQL Server 2005 Enterprise x 64 с пакетом обновления 2 сборка 3355)

·  Точное версию Windows, выпуска и построения (то есть Windows Server 2003 Enterprise x 64 с пакетом обновления 2)

·  Число процессоров

·  Объем оперативной памяти

·  Объем памяти, выделенной для SQL

·  Если SQL является 32-разрядным последовательно включены расширения AWE?

Большую часть выше информации в среде Management Studio SQL или SQL Enterprise Manager можно получить, открыв свойства сервера и щелкнуть вкладку Общие и памяти. Вкладка Общие содержит SQL версии, версии Windows, платформа, объем оперативной памяти и число процессоров. На вкладке память включает память, выделенную для SQL и (в SQL Server 2005 и SQL 2008) параметра AWE. Чтобы узнать, если включены расширения AWE в SQL Server 2000, запустите следующий в анализаторе запросов SQL:

sp_configure «Показать дополнительные параметры», 1
ИЗМЕНИТЬ КОНФИГУРАЦИЮ
ПЕРЕЙТИ
sp_configure «awe enabled»

Config_value и run_value будет равно 1, если включены расширения AWE.

·  Если ОС 32-разрядные и 4 ГБ ОЗУ или более поздней версии, параметр/PAE и/или ключи/3 gb в файле Boot.ini?

Эти параметры могут быть неправильная Если сервер был первоначально установлен с 4 ГБ ОЗУ — более и более поздней версии обновлены оперативной памяти.

Для 32-разрядные серверы с 4 ГБ оперативной памяти параметр/3 gb в файле Boot.ini увеличивает объем памяти, которая позволяет адресовать SQL (от 2 до 3 Гбайт).

Для 32-разрядных серверов с объемом ОЗУ более 4 ГБ параметр/3 gb в файле Boot.ini может фактически ограничить объем памяти, которая позволяет адресовать SQL. Для этих систем добавьте параметр/PAE в файле Boot.ini и включить расширения AWE в SQL.

·  В многопроцессорной системе что Max Degree от параллелизма (MAXDOP) равным?

В SQL Server 2005 и SQL 2008 этот параметр находится на вкладке Дополнительно в окне свойств сервера. Чтобы определить этот параметр на SQL Server 2000, запустите следующий в анализаторе запросов SQL:

sp_configure «Показать дополнительные параметры», 1
ИЗМЕНИТЬ КОНФИГУРАЦИЮ
ПЕРЕЙТИ
sp_configure «max degree of parallelism»

По умолчанию значение равно 0, что означает, что будут использованы все доступные процессоры. Установка значения 0 подходит для серверов с восемью или меньшим количеством процессоров. Для серверов с более чем восьми процессоров время, затрачиваемое SQL для координирования использования всех процессоров может привести к обратным результатам. Таким образом для серверов с более чем восьми процессоров, обычно следует задавать Максимальная степень параллелизма, равное 8:

sp_configure «Показать дополнительные параметры», 1
ПЕРЕЙТИ
ИЗМЕНИТЬ ПАРАМЕТРЫ С ПОМОЩЬЮ ПЕРЕОПРЕДЕЛЕНИЯ
ПЕРЕЙТИ
sp_configure «max degree of parallelism», 8
ПЕРЕЙТИ
ИЗМЕНИТЬ ПАРАМЕТРЫ С ПОМОЩЬЮ ПЕРЕОПРЕДЕЛЕНИЯ
ПЕРЕЙТИ

·  Буквы, содержащий файлы DW и/или Ops и базы данных Tempdb

·  Антивирусная программа настроена для исключения данных SQL и файлов журналов? Это хорошо известные, что Антивирусного по не может проверить файлы базы данных SQL и что попытка сделать это может привести к снижению производительности.

·  Свободное место на дисках, содержащий файлы DW и/или Ops и базы данных Tempdb

·  Сеть хранения данных, сравнение локальной памяти

·  Уровень RAID (0, 1, 5, 0 + 1 или 1 + 0) для дисков, используемых SQL

·  При использовании системы хранения данных, количество шпинделей каждый LUN, используемый SQL

·  В OpsMgr 2007 SP1 является событие DW интерьерам исправления (969130) или накопительного исправления 1 (SP1) (971541) применяется?

·  Если преобразованный MP Exchange 2007 используется или никогда не используется, сколько строк находятся в LocalizedText в Ops DB и EventPublisher таблицы в базе данных DW? Чтобы узнать, запустите следующую команду:

Используйте SELECT COUNT(*) FROM LocalizedText OperationsManager
Используйте SELECT COUNT(*) FROM EventPublisher OperationsManagerDW

Счетчики, чтобы определить нагрузку на память:

·  MSSQL$<instance>: Диспетчер буферов: страница нагреву – как долго сохранять страниц в буферном пуле. Если это значение меньше 300 секунд, это может означать, что сервер может использовать больше памяти. Он также может привести к фрагментации индекса.</instance>

·  MSSQL$<instance>: Диспетчер буферов: отложенных записей/с — отложенной записи освобождает место в буфере, перемещая страницы на диск. Как правило значение не должно превышать постоянно 20 операций записи в секунду. В идеальном случае было бы близка к нулю. </instance>

·  Память: Доступно МБ - значения ниже 100 МБ может означать недостаток памяти. Нехватка памяти четко присутствует, когда эта сумма превышает 10 МБ.

·  Процесс: Private Bytes: _Total – это объем памяти (физические и страницы) совместно используется всеми процессами.

·  Процесса: Рабочий набор: _Total – это объем физической памяти, используется совместно всеми процессами. Если значение для этого счетчика, значительно ниже, значение для процесса: байт исключительного пользования: _Total, значит слишком сильно подкачки процессов. Возможно значительное различие более чем на 10%.

Счетчики для идентификации диска давление: записывать эти счетчики физического диска для всех дисков, содержащий файлы данных или журналов SQL:

·  % Времени простоя – выводится время отсутствия активности диска. Все, что ниже 50% может указывать на узкое место, связанное с диска.

·  Средняя длина очереди диска – это значение не должно превышать 2 раза количество шпинделей LUN. Например если LUN 25 шпинделей, приемлемо значение 50. Если LUN 10 шпинделей, тем не менее, слишком большое значение 25. Можно использовать следующие формулы на основе RAID-уровень и количество дисков в конфигурации RAID

RAID 0 – все диски работу в RAID 0, установка
Средняя длина очереди диска<= #="" (disks="" in="" the="" array)=""></=>

RAID 1 – половина диски являются «работу» таким образом, только половина из них могут быть подсчитаны по направлению к очереди дисков
Средняя длина очереди диска<= #="" (disks="" in="" the="" array/2)=""></=>

RAID 10 – половина диски являются «работу» таким образом, только половина из них могут быть подсчитаны по направлению к очереди дисков

Средняя длина очереди диска<= #="" (disks="" in="" the="" array/2)=""></=>

RAID 5 – все диски при выполнении рабочего набора RAID 5
Средняя длина очереди диска<= #="" disks="" in="" the="" array=""></=>

·  Средняя Disk sec/Transfer – время в секундах, затрачиваемое на выполнение одного дискового ввода-вывода.

·  Средний размер одного чтения с диска – среднее время в секундах для чтения данных с диска.

·  Средняя сек записи на диск — Среднее время в секундах для записи данных на диск.

Выше три счетчика должно быть вокруг.020 (20 мс) или ниже согласованным и никогда не exceed.050 (50 мс). Ниже приведены пороговые значения, описанные в руководстве по устранению проблем производительности SQL.

Меньше 10 мс – очень хорошо
От 10 до 20 мс подтверждения
Между 20-50 мс медленно требует внимания
Больше, чем 50 мс – узкое место серьезные ввода/вывода

·  Диск байт в секунду — количество байтов, передаваемых на или с диска в секунду.

·  Обращений к диску/сек: количество операций ввода-вывода в секунду (IOPS).

Когда % времени простоя мала (10% или меньше) – это означает, что диск находится в полном объеме – выше два счетчика обеспечит хорошее представление о Максимальная пропускная способность диска в байтах и операций ввода-ВЫВОДА, соответственно. Пропускная способность диска SAN высоко переменная, в зависимости от количества дисков, скорость дисков и скорость канала. Лучше всего получить у поставщика SAN, чтобы узнать, сколько байтов и операций ввода-ВЫВОДА диска, должны поддерживать. % Времени простоя низкого значения для этих двух счетчиков не соответствуют ожидаемым пропускную способность диска, привлечь поставщиков сети хранения данных для устранения неполадок.

он ссылкам, замечательный ресурс для получения глубокого понимания устранения неполадок производительности SQL:


Устранение проблем производительности SQL Server 2005: http://TechNet.Microsoft.com/en-us/library/cc966540.aspx

Устранение проблем с производительностью в SQL Server 2008:

http://MSDN.Microsoft.com/en-us/library/dd672789 (SQL.100) .aspx

Счетчики производительности OpsMgr 2007
В следующих разделах описаны счетчики производительности, которые можно использовать для наблюдения и устранения неполадок производительности OpsMgr.

Роль сервера шлюза:Счетчики общей производительности: эти счетчики показывают общее быстродействие шлюза:

· Процессор (_Total) \ % загруженности процессора

· Memory\% использования выделенной памяти

· Сетевой интерфейс (*) \Bytes/сек

· Логический диск (*) \ процент времени бездействия

·  Логический диск (*) \Средняя. LengthOpsMgr очереди диска универсальные счетчики производительности процессов: эти счетчики показывают общую производительность OpsMgr процессы шлюза:

·  Процесс (HealthService) \%Processor времени

·  Обработать (HealthService) \Private байт (Depend на сколько агентов управления этот шлюз, этот номер может отличаться; он может быть несколько сотен мегабайт).

·  \Thread процесс (HealthService) счетчик

·  Процесс (HealthService) \Virtual байт

·  Процесс (HealthService) \Рабочий набор

·  Процесс (MonitoringHost *) \ % загруженности процессора

·  Процесс (MonitoringHost *) \Байтов

·  Процесс (MonitoringHost *) \Thread счетчик

·  Процесс (MonitoringHost *) \Virtual байт

·  Обрабатывать (MonitoringHost *) \Рабочий SetOpsMgr конкретных счетчиков производительности: счетчики, OpsMgr определенных счетчиков; они указывают на производительность OpsMgr по различным аспектам на шлюзе.

·  Счетчик Service\Workflow работоспособности

·  \Active работоспособности службы управления группами (*), загрузки файлов (это это количество передач файлов, обработка данного шлюза, например время загрузки файлов MP для агентов, если велико для типа long, а не удалить и много MP Импорт происходит в данный момент не существует, то в передачи файлов может привести к проблемам.)

·  Работоспособность службы управления группами (*) \Отправка очередь % используемых (это размер постоянные очереди, если он больше, чем 10 в течение длительного времени и не восстановить, а затем очередь была создана резервная вызвано перегруженные системы OpsMgr, например управления сервером/DB слишком занят или отключен)

·  Получено Connector\Bytes OpsMgr (это число сетевых байт, полученных шлюз, то есть размер входящих байт до распаковки)

·  Передаваемые Connector\Bytes OpsMgr (это номер сети байтов, отправленных службой шлюза, то есть размер исходящих байт после сжатия)

·  Получено байт Connector\Data OpsMgr (это число байтов данных, полученных от шлюза, то есть размер входных данных после распаковки)

·  Передано байт Connector\Data OpsMgr (это число байтов данных, отправленных шлюз, то есть размер исходящих данных перед их сжатие)

·  Connector\Open соединений OpsMgr (это число подключений, открытых на шлюзе. Должно быть так же, как количество агентов / MSs, непосредственно подключенный к нему)

Управление ролью сервера:Счетчики общей производительности: эти счетчики показывают общую производительность сервера управления:

·         Процессор (_Total) \ % загруженности процессора

·         Memory\% использования выделенной памяти

·         Сетевой интерфейс (*) \Bytes/сек

·         Логический диск (*) \ процент времени бездействия

·         Логический диск (*) \Средняя. LengthOpsMgr очереди диска универсальные счетчики производительности процессов: эти счетчики показывают общую производительность OpsMgr процессы на сервере управления:

·         Процесс (HealthService) \ % загруженности процессора

·         Обработать (HealthService) \Private байт (Depend на сколько агентов управления этот сервер управления, это число может быть иным, может быть несколько сотен байтов M).

·         \Thread процесс (HealthService) счетчик

·         Процесс (HealthService) \Virtual байт

·         Процесс (HealthService) \Рабочий набор

·         Процесс (MonitoringHost *) \ % загруженности процессора

·         Процесс (MonitoringHost *) \Байтов

·         Процесс (MonitoringHost *) \Thread счетчик

·         Процесс (MonitoringHost *) \Virtual байт

·         Обрабатывать (MonitoringHost *) \Рабочий SetOpsMgr конкретных счетчиков производительности: счетчики, OpsMgr определенных счетчиков; они указывают на производительность OpsMgr по различным аспектам на сервере управления:

·         Счетчик Service\Workflow работоспособности (количество рабочих процессов, на котором выполняется на сервере управления)

·         \Active работоспособности службы управления группами (*), загрузки файлов (это это количество передач файлов, обработка этот сервер управления, например время загрузки файлов MP для агентов, если велико для типа long, а не удалить и много MP Импорт происходит в данный момент не существует, то в передачи файлов может привести к проблемам.)

·         Работоспособность службы управления группами (*) \Отправка очередь % используемых (это размер постоянные очереди, если он больше, чем 10 в течение длительного времени и не восстановить, а затем очередь была создана резервная вызвано перегруженные системы OpsMgr, например корневой сервер управления слишком занят или отключен)

·         \Bind работоспособности службы управления группами (*) скорость передачи данных источника элемента Drop (число элементов данных, отбрасываемых сервером управления для записи действий коллекции данных DB/DW, когда этот счетчик не 0, это означает, что перегруженные /DB сервер управления, он не может обрабатывать входящий элемент данных достаточно быстро или нет таких ситуаций разбивки элемента данных. Удалено элементов данных повторит отправку агентами и когда перегруженные / burst ситуация на этих данных, элементы вставляются DB/DW)

·         \Bind группами управления обслуживанием (*) работоспособности исходного элемента входящих скорость данных (это число элементов данных, полученных сервером управления для операций записи коллекции данных DB/DW)

·         \Bind группами управления обслуживанием (*) работоспособности исходного элемента Post скорость (это число данных элементов управления сервера для операций записи коллекции данных DB/DW написан от руки DB/DW)

·         Получено Connector\Bytes OpsMgr (это число байтов сети, полученных сервером управления, то есть размер входящих байт до распаковки)

·         Передаваемые Connector\Bytes OpsMgr (это число байтов сети, отправленных сервером управления, то есть размер исходящих байт после сжатия)

·         Получено байт Connector\Data OpsMgr (это число байтов данных, полученных сервером управления, то есть размер входных данных после распаковки)

·         Передано байт Connector\Data OpsMgr (это число байтов данных, отправленных сервером управления, то есть размер исходящих данных перед их сжатие)

·         Connector\Open соединений OpsMgr (это число подключений, открытых на сервере управления. Должно быть так же, как количество агентов / корневой сервер управления, непосредственно подключенный к нему)

·         Модули (*) \Средняя действие записать DB OpsMgr. размер пакета (число элементов данных и пакетов, полученных DB писать модули действие, если это число равно 5000, это означает, что происходит в пакетном режиме элемент данных).

·         Модули (*) \Средняя действие записать DB OpsMgr. время обработки (это число модулей действие записи DB принимает вставить пакет DB, если это число превышает часто 60 секунд, это означает, что возникли проблемы с производительностью вставки DB.)

·         Модуль (*) \Средняя писатель DW OpsMgr. время обработки пакета, ms (это количество миллисекунд до вставки пакета элементов данных DW действия записи DW)

·         Модуль (*) \Средняя писатель DW OpsMgr. размер пакета (среднее число элементов данных и пакетов, полученных модулей записи действий DW)

·         OpsMgr DW записи модуля (*) \Batches/sec (это число пакетов, полученных DW писать модули действие в секунду)

·         Модуль (*) писатель DW OpsMgr \Data элементов/с (это число данных элементов, полученных DW писать модули действие в секунду)

·         OpsMgr DW записи модуля (*) \Dropped число элементов данных (это число данных элементов, отброшенные DW писать модули действие)

·         \Total модуля (*) писатель DW OpsMgr счетчик ошибок (число возникли ошибки в модулях действие записи DW)


Роль корневого сервера управления:Счетчики общей производительности: эти счетчики показывают общую производительность на корневой сервер управления:

Процессор (_Total) \ % загруженности процессора

Memory\% использования выделенной памяти

Сетевой интерфейс (*) \Bytes/сек

Логический диск (*) \ процент времени бездействия

Логический диск (*) \Средняя. LengthOpsMgr очереди диска универсальные счетчики производительности процессов: эти счетчики показывают общую производительность на корневой сервер управления OpsMgr процессов:

·         Процесс (HealthService) \ % загруженности процессора

·         Обработать (HealthService) \Private байт (Depend на сколько агентов, управление этой корневой сервер управления, это число может быть иным, может быть несколько сотен байтов M).

·         \Thread процесс (HealthService) счетчик

·         Процесс (HealthService) \Virtual байт

·         Процесс (HealthService) \Рабочий набор

·         Процесс (MonitoringHost *) \ % загруженности процессора

·         Процесс (MonitoringHost *) \Байтов

·         Процесс (MonitoringHost *) \Thread счетчик

·         Процесс (MonitoringHost *) \Virtual байт

·         Процесс (MonitoringHost *) \Рабочий набор

·         Процесс (Microsoft.Mom.ConfigServiceHost) \ % загруженности процессора

·         Процесс (Microsoft.Mom.ConfigServiceHost) \Байтов

·         \Thread (Microsoft.Mom.ConfigServiceHost) процесс подсчета

·         Процесс (Microsoft.Mom.ConfigServiceHost) \Virtual байт

·         Процесс (Microsoft.Mom.ConfigServiceHost) \Рабочий набор

·         Процесс (Microsoft.Mom.Sdk.ServiceHost) \ % загруженности процессора

·         Процесс (Microsoft.Mom.Sdk.ServiceHost) \Байтов

·         \Thread (Microsoft.Mom.Sdk.ServiceHost) процесс подсчета

·         Процесс (Microsoft.Mom.Sdk.ServiceHost) \Virtual байт

·         Обработать счетчики производительности SetOpsMgr (Microsoft.Mom.Sdk.ServiceHost) \Рабочий: эти счетчики OpsMgr определенных счетчиков, они указывают на производительность различных аспектов OpsMgr на корневой сервер управления:

·         Счетчик Service\Workflow работоспособности (количество рабочих процессов, на котором выполняется эта корневого сервера управления)

·         \Active работоспособности службы управления группами (*), загрузки файлов (это это количество передач файлов, обработку этого корневого сервера управления, например конфигурации загрузки и загрузки файлов MP агентам, если высока для очень много времени и не удалить и не существует не много обнаружения или MP Импорт происходит в данный момент, то может стать проблемой в передачу файла.)

·         Работоспособность групп управления обслуживанием (*) \Отправка очереди % используется (это размер постоянные очереди)

·         \Bind работоспособности службы управления группами (*) скорость передачи данных источника элемента Drop (число элементов данных, отброшенные корневой сервер управления для записи действий коллекции данных DB/DW, когда этот счетчик не 0, это означает, что перегруженные /DB корневой сервер управления, он не может обрабатывать входящий элемент данных достаточно быстро или нет таких ситуаций разбивки элемента данных. Удалено элементов данных повторит отправку агентами и когда перегруженные / burst ситуация на этих данных, элементы вставляются DB/DW)

·         \Bind группами управления обслуживанием (*) работоспособности исходного элемента входящих скорость данных (это число элементов данных, полученных корневой сервер управления для операций записи коллекции данных DB/DW)

·         \Bind группами управления обслуживанием (*) работоспособности исходного элемента Post скорость (это число данных элементов корневого сервера управления для операций записи коллекции данных DB/DW написан от руки DB/DW)

·         Получено Connector\Bytes OpsMgr (это число сетевых байт, полученных корневой сервер управления, то есть размер входящих байт до распаковки)

·         Передаваемые Connector\Bytes OpsMgr (это число сетевых байт, отправленных корневой сервер управления, то есть размер исходящих байт после сжатия)

·         Получено байт Connector\Data OpsMgr (это число байтов данных, полученных от корневого сервера управления, то есть размер входных данных после распаковки)

·         Передано байт Connector\Data OpsMgr (это число байтов данных, отправленных корневой сервер управления, то есть размер исходящих данных перед их сжатие)

·         Connector\Open соединений OpsMgr (это число подключений, открытых на корневой сервер управления. Должно быть так же, как количество агентов и сервер управления, непосредственно подключенный к нему)

·         OpsMgr Config Service\Number из активных запросов (номер конфигурации / MP запросов это обработки службой Config)

·         OpsMgr Config Service\Number из очереди запросов (номер в очереди config / MP запросы, отправленные на конфигурации службы, если высокий в течение длительного времени, это означает, что экземпляр пространства или слишком частое изменение места MP)

·         OpsMgr SDK Service\Client соединений (соединения номер пакета SDK)

·         Модули (*) \Средняя действие записать DB OpsMgr. размер пакета (число элементов данных и пакетов, полученных DB писать модули действие, если это число равно 5000, это означает, что происходит в пакетном режиме элемент данных).

·         Модули (*) \Средняя действие записать DB OpsMgr. время обработки (это число модулей действие записи DB принимает вставить пакет DB, если это число превышает часто 60 секунд, это означает, что возникли проблемы с производительностью вставки DB.)

·         Модуль (*) \Средняя писатель DW OpsMgr. время обработки пакета, ms (это количество миллисекунд до вставки пакета элементов данных DW действия записи DW)

·         Модуль (*) \Средняя писатель DW OpsMgr. размер пакета (среднее число элементов данных и пакетов, полученных модулей записи действий DW)

·         OpsMgr DW записи модуля (*) \Batches/sec (это число пакетов, полученных DW писать модули действие в секунду)

·         Модуль (*) писатель DW OpsMgr \Data элементов/с (это число данных элементов, полученных DW писать модули действие в секунду)

·         OpsMgr DW записи модуля (*) \Dropped число элементов данных (это число данных элементов, отброшенные DW писать модули действие)

·         \Total модуля (*) писатель DW OpsMgr счетчик ошибок (число возникли ошибки в модулях действие записи DW)

Примечание. Это ЭКСПРЕСС-ПУБЛИКАЦИЯ, подготовленная непосредственно службой технической поддержки Майкрософт . Сведения, содержащиеся в данном документе, предоставлены в качестве отклика на возникшие проблемы. Из-за срочности в материалах могут быть опечатки, и в любое время и без уведомления в них могут быть внесены изменения. Чтобы получить дополнительные сведения, см. Условия использования.

Свойства

Код статьи: 2288515 - Последний отзыв: 30 мая 2011 г. - Revision: 4.0
Информация в данной статье относится к следующим продуктам.
  • Microsoft System Center Essentials 2007
  • Microsoft System Center Essentials 2007 Service Pack 1
  • Microsoft System Center Essentials 2010
  • Microsoft System Center Operations Manager 2007
  • Microsoft System Center Operations Manager 2007 Service Pack 1
  • Microsoft System Center Operations Manager 2007 R2
Ключевые слова: 
kbmt KB2288515 KbMtru
Переведено с помощью машинного перевода
ВНИМАНИЕ! Перевод данной статьи был выполнен не человеком, а с помощью программы машинного перевода, разработанной корпорацией Майкрософт. Корпорация Майкрософт предлагает вам статьи, переведенные как людьми, так и средствами машинного перевода, чтобы у вас была возможность ознакомиться со статьями базы знаний KB на родном языке. Однако машинный перевод не всегда идеален. Он может содержать смысловые, синтаксические и грамматические ошибки, подобно тому как иностранец делает ошибки, пытаясь говорить на вашем языке. Корпорация Майкрософт не несет ответственности за неточности, ошибки и возможный ущерб, причиненный в результате неправильного перевода или его использования. Корпорация Майкрософт также часто обновляет средства машинного перевода.
Эта статья на английском языке:2288515

Отправить отзыв

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com