System Center Operations Manager'da gri aracı durumlarında sorun giderme

Bu makalede, System Center Operations Manager'da (OpsMgr) bir aracı, yönetim sunucusu veya ağ geçidinin kullanılamaması veya gri renkte görüntülenmesi sorunlarının nasıl giderildiği açıklanır.

Orijinal ürün sürümü: Microsoft System Center 2012 Operations Manager
Özgün KB numarası: 2288515

Bir aracı, yönetim sunucusu veya ağ geçidi, İzleme bölmesindeki aracı adının ve simgesinin rengiyle gösterildiği gibi aşağıdaki durumlardan birine sahip olabilir.

Durum Görünüm Açıklama
Sağlıklı Yeşil onay işareti Aracı veya yönetim sunucusu normal çalışıyor.
Kritik Kırmızı onay işareti Aracıda veya yönetim sunucusunda bir sorun var.
Unknown Gri aracı adı, gri onay işareti yönetilen bilgisayarda sistem durumu hizmetini izleyen yönetim sunucusundaki sistem durumu hizmeti izleyicisi artık aracıdan sinyal almıyor. Sistem sağlığı hizmeti izleyicisi daha önce sinyaller almıştı ve durum sağlıklı olarak bildirildi. Bu, yönetim sunucularının artık aracıdan herhangi bir bilgi almadığını da gösterir.

Aracıyı çalıştıran bilgisayar çalışmıyorsa veya bağlantı sorunları varsa bu sorun oluşabilir.
Unknown Yeşil daire, onay işareti yok Bulunan öğenin durumu bilinmiyor. Bu belirli bulunan öğe için kullanılabilir bir izleyici yok.

Gri durumunun nedenleri

Aracı, yönetim sunucusu veya ağ geçidi aşağıdaki nedenlerden herhangi biri nedeniyle kullanılamaz duruma gelebilir:

  • Sinyal hatası
  • Geçersiz yapılandırma
  • Sistem iş akışları hatası
  • Operations Manager veritabanı veya veri ambarı performans sorunları
  • Yönetim sunucusu veya ağ geçidi sunucusu performans sorunları
  • Ağ veya kimlik doğrulama sorunları
  • Sistem durumu hizmeti çalışmıyor

Sorun kapsamı

Aracı gri görünen sorunu gidermeye başlamadan önce Operations Manager topolojisini anlamanız ve ardından sorunun kapsamını tanımlamanız gerekir. Aşağıdaki sorular sorunun kapsamını tanımlamanıza yardımcı olabilir:

  • Kaç aracı etkileniyor?
  • Aracılar sorunu aynı ağ kesiminde mi yaşıyor?
  • Aracılar aynı yönetim sunucusuna rapor mu yapıyor?
  • Aracılar ne sıklıkta gri bir duruma girer ve kalır?
  • Normalde bu durumdan nasıl kurtulabilirsiniz (örneğin, aracı sistem durumu hizmetini yeniden başlatın, önbelleği temizleyin, otomatik kurtarmayı kullanın)?
  • Bu aracılar için sinyal hatası uyarıları oluşturuldu mu?
  • Bu sorun günün belirli bir saatinde mi oluşuyor?
  • Bu aracıları başka bir yönetim sunucusuna veya ağ geçidine devrederseniz bu sorun devam eder mi?
  • Bu sorun ne zaman başladı?
  • Aracılarda, yönetim sunucularında, ağ geçidinde veya yönetim grubunda herhangi bir değişiklik yapıldı mı?
  • Etkilenen aracılar Windows kümelenmiş sistemler mi?
  • Health Service State klasörü virüsten koruma taramasının dışında mı?

Sorun giderme stratejisi

Sorun giderme stratejiniz, hangi bileşenin etkin olmadığı, bu bileşenin topolojinin neresinde yer aldığı ve sorunun ne kadar yaygın olduğu tarafından belirlenir. Aşağıdaki koşulları göz önünde bulundurun:

  • Belirli bir yönetim sunucusuna veya ağ geçidine rapor veren aracılar kullanılamıyorsa, sorun giderme işleminin yönetim sunucusu veya ağ geçidi düzeyinde başlaması gerekir.
  • Belirli bir yönetim sunucusuna rapor veren ağ geçitleri kullanılamıyorsa, sorun giderme işlemleri yönetim sunucusu düzeyinde başlamalıdır.
  • Aracısız sistemler, ağ cihazları ve Unix ve Linux sunucuları için sorun giderme işlemi bu nesneleri izleyen aracı, yönetim sunucusu veya ağ geçidinden başlamalıdır.
  • Sorun giderme genellikle kullanılamayan bileşenin hemen üstündeki düzeyde başlar.

Senaryo 1

Sorundan yalnızca birkaç aracı etkilenir. Bu aracılar farklı yönetim sunucularına rapor sağlar. Aracılar düzenli olarak kullanılamaz durumda kalır. Sorunu geçici olarak çözmeye yardımcı olmak için aracı önbelleğini temizleyebilse de, sorun birkaç gün sonra yinelenir.

Senaryo 1 için çözüm

Bu senaryoda sorunu çözmek için şu adımları izleyin:

  1. Etkilenen işletim sistemlerine uygun düzeltmeyi uygulayın.
  2. Aracı önbelleğini virüsten koruma taramasının dışında tutun. Daha fazla bilgi için bkz. Operations Manager ile ilgili virüsten koruma dışlamaları için öneriler.
  3. Sağlık hizmetini durdurun.
  4. Aracı önbelleğini temizleyin.
  5. Sistem sağlığı hizmetini başlatın.

Senaryo 2

Sorundan yalnızca birkaç aracı etkilenir. Bu aracılar farklı yönetim sunucularına rapor sağlar. Aracılar sürekli devre dışı kalır. Aracı önbelleğini temizleyebiliyor olmanıza rağmen bu işlem sorunu çözmez.

Senaryo 2 için çözüm

Bu senaryoda sorunu çözmek için şu adımları izleyin:

  1. Sistem durumu hizmetinin açık olup olmadığını ve şu anda yönetim sunucusunda mı yoksa ağ geçidinde mi çalıştığını belirleyin. Sistem durumu hizmeti yanıt vermeyi durdurduysa, sorunun nedenini saptamaya yardımcı olmak için hizmet kilitlenme modunda bir ADPlus dökümü oluşturun. Daha fazla bilgi için bkz. "Askıda kalma" ve "kilitlenme" sorunlarını gidermek için ADPlus.vbs kullanma

  2. Aşağıdaki olaylardan herhangi birini bulmak için aracıdaki Operations Manager olay günlüğünü inceleyin:

    Olay Kimliği: 1102
    Olay Kaynağı: HealthService
    Olay Açıklaması:
    "%2" kimliğine sahip "%3" örneği için çalışan "%4" Kuralı/İzleyicisi başlatılamıyor ve yüklenmeyecek. "%1" yönetim grubu

    Olay Kimliği: 1103
    Olay Kaynağı: HealthService
    Olay Açıklaması:
    Özet: %2 kural/izleyici başarısız oldu ve kaldırıldı, %3 kural otomatik yeniden yüklemeyi engelleyen hata sınırına ulaştı. "%1" yönetim grubu. Bu yalnızca özet olaydır, lütfen kaldırılmış kuralların/izleyicilerin açıklamalarını içeren diğer olaylara bakın.

    Olay Kimliği: 1104
    Olay Kaynağı: HealthService
    Olay Açıklaması:
    "%2" kimliğine sahip "%3" örneği için çalıştırılan "%4" iş akışındaki RunAs profili çözümlenemiyor. İş akışı yüklenmez. "%1" yönetim grubu

    Olay Kimliği: 1105
    Olay Kaynağı: HealthService
    Olay Açıklaması:
    "%4" iş akışındaki RunAs profili için tür uyuşmazlığı, kimliği:"%2" olan "%3" örneği için çalışıyor. İş akışı yüklenmez. "%1" yönetim grubu

    Olay Kimliği: 1106
    Olay Kaynağı: HealthService
    Olay Açıklaması:
    "%4" iş akışında kimliği:"%2" olan "%3" örneği için çalışan düz metin RunAs profiline erişilemiyor. İş akışı yüklenmez. "%1" yönetim grubu

    Olay Kimliği: 1107
    Olay Kaynağı: HealthService
    Olay Açıklaması:
    "%2" kimliğine sahip "%3" örneği için çalışan "%4" iş akışındaki RunAs profilinin hesabı tanımlanmadı. İş akışı yüklenmez. Lütfen bir hesabı profille ilişkilendirin. "%1" yönetim grubu

    Olay Kimliği: 1108
    Olay Kaynağı: HealthService
    Olay Açıklaması:
    "%7" Farklı Çalıştır Profilinde belirtilen bir Hesap çözümlenemiyor. Özellikle, hesap Güvenli Başvuru Geçersiz Kılma "%6" içinde kullanılır. %n%n Hesap bu bilgisayara dağıtılacak şekilde yapılandırılmadığından bu koşul oluşmuş olabilir. Bu sorunu çözmek için aşağıda belirtilen Farklı Çalıştır Profilini açmanız, SSID tarafından belirtilen Hesap girdisini bulmanız ve uygunsa Hesabı bu bilgisayara dağıtmayı seçmeniz veya hedef nesnenin belirtilen Hesabı kullanmaması için Profildeki ayarı değiştirmeniz gerekir. %n%nYönetim Grubu: %1 %n Farklı Çalıştır Profili: %7 %nSecureReferenceOverride adı: %6 %nSecureReferenceOverride Kimliği: %4 %nNesne adı: %3 %nNesne Kimliği: %2 %nHesap SSID: %5

    Olay Kimliği: 4000
    Olay Kaynağı: HealthService
    Olay Açıklaması:
    İzleme konağı yanıt vermiyor veya kilitlendi. Konak hatasının durum kodu: %1.

    Olay Kimliği: 21016
    Olay Kaynağı: OpsMgr Bağlayıcısı
    Olay Açıklaması:
    OpsMgr % 1 için iletişim kanalı kuramadı ve yük devretme ana bilgisayarları yok. %1 kullanılabilir olduğunda ve bu bilgisayardan iletişime izin verildiğinde iletişim devam edecek.

    Olay Kimliği: 21006
    Olay Kaynağı: OpsMgr Bağlayıcısı
    Olay Açıklaması:
    OpsMgr Bağlayıcısı %1:%2 bağlantısı kuramadı. Hata kodu: %3(%4). Lütfen ağ bağlantısı olduğunu, sunucunun çalıştığını ve dinleme bağlantı noktasını kaydettiğini ve hedefe trafiği engelleyen güvenlik duvarı olmadığını doğrulayın.

    Olay Kimliği: 20070
    Olay Kaynağı: OpsMgr Bağlayıcısı
    Olay Açıklaması:
    OpsMgr Bağlayıcısı %1'e bağlandı, ancak kimlik doğrulaması gerçekleştikten hemen sonra bağlantı kapatıldı. Bu hatanın en olası nedeni, aracının sunucuyla iletişim kurma yetkisinin olmaması veya sunucunun yapılandırma almamasıdır. Sunucudaki olay günlüğünde 20000 olay olup olmadığını denetleyin ve onaylanmamış aracıların bağlanmaya çalıştığına işaret edin.

    Olay Kimliği: 20051
    Olay Kaynağı: OpsMgr Bağlayıcısı
    Olay Açıklaması:
    Belirtilen sertifika şu anda geçerli olmadığından yüklenemedi. Sistem saatinin doğru olduğunu doğrulayın ve gerekirse sertifikayı yeniden yayımlayın%n Sertifika Geçerli Başlangıç Saati: %1%n Sertifika Geçerli Bitiş Saati: %2

    Olay Kaynağı: ESE
    Olay Kategorisi: Transaction Manager
    Olay Kimliği: 623
    Açıklama: HealthService (<PID>) Örnek< için >sürüm deposu("<ad>"), Mb değerinin>< en büyük boyutuna ulaştı. Uzun süre çalışan bir işlemin sürüm deposunun temizlenmesini engellemesi ve boyutunun derlenmesine neden olması olasıdır. Güncelleştirmeler, uzun süre çalışan işlem tamamen işlenene veya geri alınana kadar reddedilir. Uzun süre çalışan olası işlem:
    SessionId: <değer>
    Oturum bağlamı: <değer>
    Oturum bağlamı ThreadId: <değer>.
    Temizleme: <değer>

  3. Aşağıdaki belirli olayları bulursanız şu yönergeleri izleyin:

    • 1102 ve 1103 olayları: Bu olaylar bazı iş akışlarının yüklenemediğine işaret eder. Bunlar temel sistem iş akışlarıysa, bu olaylar soruna neden olabilir. Bu durumda, bu olayları çözmeye odaklanın.

    • Olaylar 1104, 1105, 1106, 1107 ve 1108: Bu olaylar 1102 ve 1103 olaylarının oluşmasına neden olabilir. Bu durum genellikle yanlış yapılandırılmış Farklı Çalıştır hesapları nedeniyle ortaya çıkar. Örneğin, Farklı Çalıştır hesapları yanlış sınıfla kullanılacak şekilde yapılandırılmış veya aracıya dağıtılacak şekilde yapılandırılmamış.

    • Olay 4000: Bu olay, Monitoringhost.exe işleminin kilitlendiğini gösterir. Bu soruna DLL uyuşmazlığı veya eksik kayıt defteri anahtarları neden oluyorsa, aracıyı yeniden yükleyerek sorunu çözebilirsiniz. Sorun devam ederse aşağıdaki yöntemleri kullanarak çözmeyi deneyin:

    • Olay Kimliği 21006: Bu olay aracı ile yönetim sunucusu arasında iletişim sorunları olduğunu gösterir. Aracı karşılıklı kimlik doğrulaması için bir sertifika kullanıyorsa, sertifikanın süresinin dolmadığını ve aracının doğru sertifikayı kullandığını doğrulayın. Kerberos kullanılıyorsa, aracının Active Directory ile iletişim kurabildiğini doğrulayın. Kimlik doğrulaması düzgün çalışıyorsa bu, aracıdan gelen paketlerin yönetim sunucusuna veya ağ geçidine ulaşmadığı anlamına gelebilir. Aracıdan yönetim sunucusuna 5723 numaralı bağlantı noktasına bir telnet oluşturmayı deneyin. Ayrıca, iletişim hatalarını yeniden oluştururken aracı ile yönetim sunucusu arasında eşzamanlı bir ağ izlemesi çalıştırın. Bu, paketlerin yönetim sunucusuna ulaşıp ulaşmadığını ve iki bileşen arasındaki herhangi bir cihazın trafiği iyileştirmeye çalışıp çalışmadığını veya bazı paketleri bırakıp bırakmadığını belirlemenize yardımcı olabilir. Daha fazla bilgi için bkz. Ağ İzleyicisi kullanarak veri toplama.

    • Olay Kimliği 623: Bu olay genellikle bir yönetim sunucusunun veya aracı bilgisayarın birçok iş akışını yönettiği büyük bir Operations Manager ortamında gerçekleşir. Daha fazla bilgi için bkz. Operations Manager konsolunda bir veya daha fazla yönetim sunucusu ve yönetilen cihazları soluk görüntüleniyor.

Senaryo 3

Belirli bir yönetim sunucusuna veya ağ geçidine rapor veren tüm aracılar kullanılamaz.

Senaryo 3 için çözüm

Bu senaryoda sorunu çözmek için şu adımları izleyin:

  1. Yönetim sunucusunun veya ağ geçidinin ne tür iş yüklerini izlediğini belirlemeye çalışın. Bu tür iş yükleri ağ cihazlarını, platformlar arası aracıları, yapay işlemleri, Windows aracılarını ve aracısız bilgisayarları içerebilir.

  2. Sistem durumu hizmetinin yönetim sunucusunda mı yoksa ağ geçidinde mi çalıştığını belirleyin.

  3. Yönetim sunucusunun bakım modunda çalışıp çalışmadığını belirleyin. Gerekirse sunucuyu bakım modundan kaldırın.

  4. Senaryo 2'de listelenen olaylardan herhangi biri için aracıdaki Operations Manager olay günlüğünü inceleyin. Olay kimliği 21006 varsa, 2. senaryo için çözüm bölümünde belirtilen yönergeleri izleyin. Bu durumda, bu olay yönetim sunucusunun veya ağ geçidinin üst sunucusuyla iletişim kuramadığını gösterir. Bir ağ geçidi için üst sunucu herhangi bir yönetim sunucusu olabilir. (Senaryo 2 için Çözüm'deki 3. adıma bakın.)

  5. Aşağıdaki olaylar için Operations Manager olay günlüğünü inceleyin. Bu olaylar genellikle veya veritabanını barındıran yönetim sunucusunda veya Microsoft SQL Server performans sorunlarının OperationsManagerOperationsManagerDW olduğunu gösterir:

    Olay Kimliği: 2115
    Olay Kaynağı: HealthService
    Olay Açıklaması:
    %1 Yönetim Grubundaki Bağlama Veri Kaynağı iş akışına öğe gönderdi, ancak %5 saniye içinde yanıt almadı. Bu, iş akışıyla ilgili bir performans veya işlevsel sorunu gösterir.%n İş Akışı Kimliği: %2%n Örnek: %3%n Örnek Kimliği: %4%n

    Olay Kimliği: 5300
    Olay Kaynağı: HealthService
    Olay Açıklaması:
    Yerel sistem sağlığı hizmeti iyi durumda değil. Varlık durumu değişiklik akışı bekleyen onay ile durduruldu. %n%nYönetme Grubu: %2 %nYönetme Grubu Kimliği: %1

    Olay Kimliği: 4506
    Olay Kaynağı: HealthService
    Olay Açıklaması: Operations Manager
    "%1" yönetim grubundaki "%4" kimliğine sahip "%3" örneği için çalışan "%2" kuralındaki çok fazla bekleyen veri nedeniyle veriler bırakıldı.

    Olay Kimliği: 31551
    Olay Kaynağı: Sistem Sağlığı Hizmeti Modülleri
    Olay Açıklaması:
    veriler Data Warehouse depolanamadı. İşlem yeniden denenecek.%rException '%5': %6 %n%nBu işlemden bir veya daha fazla iş akışı etkilendi. %n%nÇalışir akışı adı: %2 %nÇalma adı: %3 %nEniyet Kimliği: %4 %nYönetim grubu: %1

    Olay Kimliği: 31552
    Olay Kaynağı: Sistem Sağlığı Hizmeti Modülleri
    Olay Açıklaması:
    Veriler Data Warehouse depolanamadı.%rException '%5': %6 %n%nBu işlemden bir veya daha fazla iş akışı etkilendi. %n%nÇalışir akışı adı: %2 %nÇalma adı: %3 %nEniyet Kimliği: %4 %nYönetim grubu: %1

    Olay Kimliği: 31553
    Olay Kaynağı: Sistem Sağlığı Hizmeti Modülleri
    Olay Açıklaması:
    Veriler Data Warehouse hazırlama alanına yazıldı ancak sonraki işlemlerden birinde işleme başarısız oldu.%rException '%5': %6 %n%nBu işlemden bir veya daha fazla iş akışı etkilendi. %n%nÇalışir akışı adı: %2 %nÇalma adı: %3 %nEniyet Kimliği: %4 %nYönetim grubu: %1

    Olay Kimliği: 31557
    Olay Kaynağı: Sistem Sağlığı Hizmeti Modülleri
    Olay Açıklaması:
    Data Warehouse veritabanından eşitleme işlemi durumu bilgileri alınamadı. İşlem yeniden denenecek.%rException '%5': %6 %n%nBu işlemden bir veya daha fazla iş akışı etkilendi. %n%nÇalışir akışı adı: %2 %nÇalma adı: %3 %nEniyet Kimliği: %4 %nYönetim grubu: %1

  6. Farklı Çalıştır hesabı yapılandırmaları veya Farklı Çalıştır hesapları için eksik izinler nedeniyle olay kimliği 3155X de günlüğe kaydedilebilir.

Not

Yönetim sunucusu veya ağ geçidi performansı ve SQL Server performansı sorunlarını gidermek için Senaryo 4 için çözüm bölümüne bakın.

Senaryolar 4

Belirli bir yönetim sunucusuna rapor veren tüm aracılar, sağlıklı ve gri durumlar arasında aralıklı olarak değişir. Ya da ortamdaki tüm aracılar sağlıklı ve gri durumlar arasında aralıklı olarak geçiş yapıyor.

Senaryo 4 için çözüm

Sorunu çözmek için önce sorunun nedenini belirleyin. Geçici sunucunun kullanılamama nedenlerinin yaygın nedenleri şunlardır:

  • Aracıların üst sunucusu geçici olarak çevrimdışı.
  • Aracılar yönetim sunucusuna uyarılar, durumlar, bulmalar vb. gibi işletimsel verilerle dolup taşıyor. Bu, Operations Manager veritabanında ve Operations Manager sunucularında sistem kaynaklarının kullanımının artmasına neden olabilir.
  • Ağ kesintileri üst sunucu ile aracılar arasında geçici bir iletişim hatasına neden oldu.
  • Yönetim paketi (MP) değişiklikleri oluştu. Operations Manager konsolunda, bu değişiklikler bir Operations Manager yapılandırması ve aracılara MP yeniden dağıtımı gerektirir. Değişiklik daha büyük bir aracı tabanını etkiliyorsa, bu durum Operations Manager veritabanında ve Operations Manager sunucularında sistem kaynakları kullanımının artmasına neden olabilir.

Bu senaryolarda sorun gidermenin anahtarı, sunucunun kullanılamama süresini ve oluştuğu günün saatini anlamaktır. Bu, sorunun kapsamını hızla daraltmanıza yardımcı olur.

Yönetim sunucusu ve ağ geçidi performansı sorunlarını giderme

Yönetim sunucusu

Bir yapılandırma güncelleştirmesi sırasında (MP içeri aktarma ve bulmadan kaynaklanır) tipik performans sorunları, ilk olarak CPU ve ikinci olarak Operations Manager yükleme diski G/Ç'dir. Yönetim sunucusu, yapılandırma dosyalarını hedef aracılara iletmekle sorumludur.

İşletimsel veri toplamada performans sorunları genellikle CPU'lardan kaynaklanmaktadır. Disk G/Ç en yüksek kapasitede de olabilir, ancak bu mümkün değildir. Yönetim sunucusu, gelen işletimsel verilerin sıkıştırmasını açıp şifresini çözmek ve bunları İşletimsel veritabanına eklemekle sorumludur. Ayrıca, işletimsel verileri aldıktan sonra aracılara veya ağ geçitlerine bildirim (ACK) gönderir ve bu giden ACK'leri geçici olarak depolamak için disk kuyruğa almayı kullanır.

Ağ geçidi

Ağ geçidi hem CPU'ya hem de G/Ç'ye bağlıdır. Ağ geçidi büyük miktarda veri aktarırken hem CPU hem de G/Ç işlemleri yüksek kullanım gösterebilir. CPU kullanımının çoğu, gelen verilerin sıkıştırma, şifreleme ve şifre çözme işlemlerinin yanı sıra bu verilerin aktarımından kaynaklanır. Ağ geçidi tarafından ve aracılardan alınan tüm veriler, ağ geçidi Sistem Durumu hizmeti tarafından okunmak ve yönetim sunucusuna iletilmesi için diskteki kalıcı bir kuyrukta depolanır. Bu, yoğun disk kullanımına neden olabilir. Bu kullanım, ağ geçidi geçici olarak çevrimdışı olduğunda önemli olabilir ve daha sonra ağ geçidi çevrimdışıyken aracıların oluşturduğu ve göndermeye çalıştığı birikmiş aracı verilerini işlemesi gerekir.

Bu durumda sorunu gidermek için, etkilenen her yönetim sunucusu veya ağ geçidi için aşağıdaki bilgileri toplayın:

  • Tam Windows sürümü, sürümü ve derleme numarası

  • İşlemci sayısı

  • RAM miktarı

  • Sistem Sağlığı Hizmeti Durumu klasörünü içeren sürücü

  • Virüsten koruma yazılımının Sistem Sağlığı Hizmeti deposunu dışlamak üzere yapılandırılıp yapılandırılmadığı

  • Sistem Sağlığı Hizmeti Durumu tarafından kullanılan sürücü için RAID düzeyi (0, 1, 50+1 veya 1+0)

  • RAID için kullanılan disk sayısı

  • Dizi denetleyicisinde pil destekli yazma önbelleğinin etkinleştirilip etkinleştirilmediği

SQL Server performansı sorunlarını giderme

İşletimsel veritabanı (OperationsManager)

Veritabanı için OperationsManager en olası performans sorunu disk dizisidir. Disk dizisi en yüksek G/Ç kapasitesinde değilse, bir sonraki olası performans sorunu CPU'dur. Veritabanında zaman zaman yavaşlamalar ve işletimsel veri fırtınaları (olayların, uyarıların ve performans verilerinin veya nispeten uzun süre devam eden durum değişikliklerinin yüksek sıklığı) yaşanacaktır. Kısa bir patlama genellikle uzun bir süre boyunca önemli bir gecikmeye neden olmaz.

İşletimsel veri ekleme sırasında veritabanı diskleri öncelikli olarak yazma işlemleri için kullanılır. CPU kullanımına SQL Server değişim sıklığı neden oluyor. Bu durum büyük ve karmaşık sorgular, yoğun veri ekleme ve büyük tabloların bakımı (varsayılan olarak gece yarısı gerçekleşir) olduğunda ortaya çıkabilir. Genellikle, büyük olayların ve performans veri tablolarının bile bakımı aşırı CPU veya disk kaynağı kullanmaz. Ancak, uyarı ve durum değişikliği tablolarının bakımı büyük tablolar için YOĞUN CPU kullanımına neden olabilir.

Veritabanı, MP içeri aktarmalarından veya büyük bir örnek alanı değişikliğinden kaynaklanan yapılandırma yeniden dağıtım artışlarını işlediğinde de CPU'ya bağlıdır. Bu gibi durumlarda, Yapılandırma hizmeti veritabanını yeni aracı yapılandırması için sorgular. Bu genellikle hizmet yapılandırma güncelleştirmelerini aracılara göndermeden önce veritabanında CPU ani artışlarının oluşmasına neden olur.

Veri ambarı (OperationsManagerDW)

Veritabanı için OperationsManagerDW en olası performans sorunu disk dizisidir. Bu durum genellikle büyük işletimsel veri eklemeleri nedeniyle oluşur. Bu gibi durumlarda diskler çoğunlukla yazma işlemleriyle meşguldür. Genellikle diskler, el ile oluşturulan Raporlama görünümlerini işlemek dışında birkaç okuma gerçekleştirir çünkü bunlar veri ambarı üzerinde sorgu çalıştırır.

CPU kullanımına SQL Server değişim sıklığı neden olur. Yoğun bölümleme etkinliği (tablolar büyük hale geldiğinde ve bölümlendiğinde), karmaşık raporların oluşturulması ve veri ambarının sürekli olarak eşitlenmesi gereken veritabanında büyük miktarda uyarı sırasında CPU ani artışları oluşabilir.

Genel sorun giderme

Bu durumda sorunu gidermek için, etkilenen her yönetim sunucusu veya ağ geçidi için aşağıdaki bilgileri toplayın:

  • Tam Windows sürümü, sürümü ve derleme numarası

  • İşlemci sayısı

  • RAM miktarı

  • SQL Server ayrılan bellek miktarı

  • SQL Server 32 bit olup olmadığı ve AWE'nin etkinleştirilip etkinleştirilmediği

    Bu bilgilerin çoğunu SQL Server Management Studio veya SQL Server Enterprise Yöneticisi'nde bulabilirsiniz. Bunu yapmak için sunucunun Özellikler penceresini açın ve ardından Genel ve Bellek sekmelerini seçin. Genel sekmesi SQL Server sürümünü, Windows sürümünü, platformu, RAM miktarını ve işlemci sayısını içerir. Bellek sekmesi, SQL Server ayrılmış belleği içerir. Microsoft SQL Server 2008'de Bellek sekmesi AWE seçeneğini de içerir.

    İşletim sistemi 32 bit ve RAM 4 GB veya daha büyükse, veya /3gb anahtarlarının /pae Boot.ini olup olmadığını denetleyin. Dosya. Sunucu başlangıçta 4 GB veya daha az RAM'e sahip olarak yüklenmişse ve RAM daha sonra yükseltildiyse bu seçenekler yanlış yapılandırılabilir.

    4 GB RAM'e sahip 32 bit sunucularda Boot.ini anahtarı, /3gb SQL Server adresleyebilecek bellek miktarını artırır (2 GB'tan 3 GB'a kadar). 4 GB'tan fazla RAM'e sahip 32 bit sunucularda Boot.ini anahtarı, /3gb SQL Server adresleyebilecek bellek miktarını sınırlayabilir. Bu sistemler için anahtarı Boot.ini ekleyin /pae ve ardından SQL Server'de AWE'yi etkinleştirin.

    Çok işlemcili bir sistemde Maksimum Paralellik Derecesi (MAXDOP) ayarını denetleyin. SQL Server 2008'de bu seçenek, sunucunun Özellikler iletişim kutusundaki Gelişmiş sekmesindedir.

    Varsayılan değer 0'dır ve bu da tüm kullanılabilir işlemcilerin kullanılacağı anlamına gelir. Sekiz veya daha az işlemciye sahip sunucular için 0 ayarı uygundur. Sekizden fazla işlemciye sahip sunucular için, tüm işlemcilerin kullanımını koordine etmek için SQL Server geçen süre karşı üretime neden olabilir. Bu nedenle, sekizden fazla işlemcisi olan sunucular için genellikle Maksimum Paralellik Derecesini8 değerine ayarlamanız gerekir. Bunu yapmak için SQL Query Analyzer'da aşağıdaki komutu çalıştırın:

    sp_configure 'show advanced options', 1
    GO
    RECONFIGURE WITH OVERRIDE
    GO
    sp_configure 'max degree of parallelism', 8
    GO
    RECONFIGURE WITH OVERRIDE
    GO
    
  • Veri ambarı, Operations Manager DB ve Tempdb dosyalarını içeren sürücü harfleri

  • Virüsten koruma yazılımının SQL verilerini ve günlük dosyalarını dışlamak üzere yapılandırılıp yapılandırılmadığı (Virüsten koruma yazılımıyla SQL Server veritabanı dosyalarını taramak performansı düşürebilir.)

  • Veri ambarı, Operations Manager DB ve Tempdb dosyaları içeren sürücülerde boş alan miktarı

  • Depolama türü (SAN veya yerel)

  • SQL Server tarafından kullanılan sürücüler için RAID düzeyi (0, 1, 5, 0+1 veya 1+0)

  • SAN depolama kullanılıyorsa: SQL Server tarafından kullanılan her LUN üzerindeki iş mili sayısı

  • Dönüştürülen Exchange 2007 yönetim paketi kullanılıyorsa veya daha önce kullanılmışsa: Operations Manager veritabanındaki LocalizedText tablodaki ve veri ambarı veritabanındaki EventPublisher tablodaki satır sayısı

    Satır tutarlarını belirlemek için aşağıdaki komutları çalıştırın:

    USE OperationsManager SELECT COUNT(*) FROM LocalizedText
    USE OperationsManagerDW SELECT COUNT(*) FROM EventPublisher
    

Bellek baskısını tanımlamak için sayaçlar

Performans sayacı adı Açıklama
MSSQL$<instance>: Buffer Manager: Sayfa ömrü beklentisi Sayfaların arabellek havuzunda ne kadar süre kalıcı olduğu. Bu değer 300 saniyenin altındaysa, sunucunun daha fazla bellek kullanabileceğini gösterebilir. Dizin parçalanmasından da kaynaklanabilir.
MSSQL$<instance>: Buffer Manager: Gecikmeli yazma/sn Gecikmeli yazıcı, sayfaları diske taşıyarak arabellekte yer açar. Genel olarak, değer tutarlı olarak saniyede 20 yazmayı aşmamalıdır. İdeal olan sıfıra yakın olmasıdır.
Bellek: Kullanılabilir Mbytes 100 MB'ın altındaki değerler bellek baskısına işaret edebilir. Bu miktar 10 MB'ın altında olduğunda bellek baskısı açıkça ortaya konur.
İşlem: Özel Baytlar: _Total Bu, birleştirilen tüm işlemler tarafından kullanılan bellek miktarıdır (fiziksel ve sayfa).
İşlem: Çalışma Kümesi: _Total Bu, tüm işlemler tarafından birleştirilen fiziksel bellek miktarıdır. Bu sayacın değeri değerinin Process: Private Bytes: _Totalönemli ölçüde altındaysa, işlemlerin çok fazla sayfalandığını gösterir. %10'dan fazla fark büyük olasılıkla önemlidir.

Disk baskısını tanımlamak için sayaçlar

SQL verileri veya günlük dosyaları içeren tüm sürücüler için bu fiziksel disk sayaçlarını yakalayın:

  • % Boşta Kalma Süresi: Ne kadar disk boşta kalma süresi bildiriliyor? Yüzde 50'nin altındaki herhangi bir şey disk performans sorununa işaret edebilir.

  • Ortalama Disk Kuyruğu Uzunluğu: Bu değer lun üzerindeki iş mili sayısının iki katını aşmamalıdır. Örneğin, lun 25 mili varsa, 50 değeri kabul edilebilir. Ancak, lun 10 mili varsa, 25 değeri çok yüksektir. RAID yapılandırmasındaki RAID düzeyine ve disk sayısına göre aşağıdaki formülleri kullanabilirsiniz:

    • RAID 0: Tüm diskler bir RAID 0 kümesinde çalışıyor

    • Ortalama Disk Kuyruğu Uzunluğu<= # (Dizideki diskler) *2

    • RAID 1: Disklerin yarısı iş yapıyor; Bu nedenle, bunların yalnızca yarısı disk kuyruğuna doğru sayılabilir

    • Ortalama Disk Kuyruğu Uzunluğu<= # (Dizideki diskler/2) *2

    • RAID 10: Disklerin yarısı "iş yapıyor"; Bu nedenle, bunların yalnızca yarısı disk kuyruğuna doğru sayılabilir

    • Ortalama Disk Kuyruğu Uzunluğu<= # (Dizideki diskler/2) *2

    • RAID 5: Tüm diskler bir RAID 5 kümesinde çalışıyor

    • Ortalama Disk Kuyruğu Uzunluğu<= Dizideki #Diskler *2

    • Ortalama Disk sn/Aktarım: Bir disk G/Ç'sinin tamamlanması için gereken saniye sayısı

    • Ortalama Disk sn/Okuma: Diskteki verileri okumak için saniye cinsinden ortalama süre

    • Ortalama Disk sn/Yazma: Diske veri yazmak için saniye cinsinden ortalama süre

      Bu listedeki son üç sayaç tutarlı olarak yaklaşık 0,020 (20 ms) veya daha düşük değerlere sahip olmalı ve hiçbir zaman 0,050 (50 ms) değerini aşmamalıdır. performans sorunlarını giderme kılavuzunda SQL Server belirtilen eşikler şunlardır:

      • 10 ms'den az: çok iyi
      • 10 - 20 ms arasında: tamam
      • 20 - 50 ms arasında: yavaş, dikkat gerekiyor
      • 50 ms'den büyük: ciddi G/Ç performans sorunu
    • Disk Bayt/sn: Saniyede diske veya diskten aktarılan bayt sayısı

    • Disk Aktarımları/sn: Saniye başına giriş ve çıkış işlemlerinin sayısı (IOPS)

    Boşta Kalma Süresi % düşük olduğunda (yüzde 10 veya daha az), bu diskin tam olarak kullanıldığı anlamına gelir. Bu durumda, bu listedeki son iki sayaç (Disk Bayt/sn ve Disk Aktarımları/sn), sırasıyla sürücünün bayt cinsinden ve IOPS cinsinden en yüksek aktarım hızının iyi bir göstergesini sağlar. SAN sürücüsünün aktarım hızı, mil sayısına, sürücülerin hızına ve kanalın hızına bağlı olarak oldukça değişkendir. En iyi sonuç, sürücünün kaç bayt ve IOPS desteklemesi gerektiğini öğrenmek için SAN satıcısına danışın. Boşta Kalma Süresi Yüzdesi düşükse ve bu iki sayacın değerleri sürücünün beklenen aktarım hızını karşılamıyorsa, sorun gidermek için SAN satıcısıyla iletişim kurun.

SQL Server performans sorunlarını giderme kılavuzu, sorun giderme SQL Server performansı hakkında daha ayrıntılı içgörü sağlar.

Operations Manager performans sayaçları

Aşağıdaki bölümlerde Operations Manager performansını izlemek ve sorunlarını gidermek için kullanabileceğiniz performans sayaçları açıklanmaktadır.

Ağ geçidi sunucusu rolü

Genel performans sayaçları

Bu sayaçlar ağ geçidinin genel performansını gösterir:

Performans sayacı adı
İşlemci(_Total)\% İşlemci Süresi
Bellek\% Kullanılan Kaydedilmiş Bayt Sayısı
Ağ Arabirimi(*)\Toplam Bayt/sn
LogicalDisk(*)\% Boşta Kalma Süresi
LogicalDisk(*)\Ort. Disk Kuyruğu Uzunluğu
Operations Manager işlem genel performans sayaçları

Bu sayaçlar, ağ geçidindeki Operations Manager işlemlerinin genel performansını gösterir:

Performans sayacı adı Açıklama
Process(HealthService)\% İşlemci Süresi
Process(HealthService)\Private Bytes Bu ağ geçidinin yönettiği aracı sayısına bağlı olarak, bu sayı değişebilir ve birkaç yüz megabayt olabilir
Process(HealthService)\İş Parçacığı Sayısı
Process(HealthService)\Virtual Bytes
Process(HealthService)\Working Set
Process(MonitoringHost*)\% İşlemci Süresi
Process(MonitoringHost*)\Private Bytes
Process(MonitoringHost*)\İş Parçacığı Sayısı
Process(MonitoringHost*)\Virtual Bytes
Process(MonitoringHost*)\Working Set
Operations Manager'a özgü performans sayaçları

Bu sayaçlar, ağ geçidinde Operations Manager'ın belirli yönlerinin performansını gösteren Operations Manager'a özgü sayaçlardır:

Performans sayacı adı Açıklama
Sistem Durumu Hizmeti\İş Akışı Sayısı
Sistem Sağlığı Hizmeti Yönetim Grupları(*)\Etkin Dosya Yüklemeleri Bu ağ geçidinin işlemekte olduğu dosya aktarımlarının sayısı. Bu, aracılara yüklenen yönetim paketi dosyalarının sayısını temsil eder. Bu değer uzun süre yüksek bir düzeyde kalırsa ve belirli bir anda içeri aktarılan çok fazla yönetim paketi yoksa, bu koşullar dosya aktarımını etkileyen bir sorun oluşturabilir.
Sistem Sağlığı Hizmeti Yönetim Grupları(*)\Kuyruk %'sini Gönder Kullanıldı Kalıcı kuyruğun boyutu. Bu değer uzun süre 10'dan yüksek kalırsa ve düşmezse kuyruğun yedeklendiğini gösterir. Yönetim sunucusu veya veritabanı çok meşgul veya çevrimdışı olduğundan bu koşul aşırı yüklenmiş bir Operations Manager sisteminden kaynaklanır.
OpsMgr Bağlayıcısı\Alınan Bayt Sayısı Ağ geçidi tarafından alınan ağ baytlarının sayısı; yani, sıkıştırmadan önce gelen bayt sayısı.
OpsMgr Bağlayıcısı\İletilen Bayt Sayısı Ağ geçidi tarafından gönderilen ağ bayt sayısı; yani sıkıştırmadan sonra giden bayt sayısı.
OpsMgr Bağlayıcısı\Alınan Veri Baytları Ağ geçidi tarafından alınan veri baytlarının sayısı; yani, sıkıştırmadan sonra gelen veri miktarı.
OpsMgr Bağlayıcısı\İletilen Veri Baytları Ağ geçidi tarafından gönderilen veri baytlarının sayısı; yani sıkıştırmadan önce giden veri miktarı.
OpsMgr Connector\Open Connections Ağ geçidinde açık olan bağlantı sayısı. Bu sayı, doğrudan ağ geçidine bağlı aracıların veya yönetim sunucularının sayısıyla aynı olmalıdır.

Yönetim sunucusu rolü

Genel performans sayaçları

Bu sayaçlar yönetim sunucusunun genel performansını gösterir:

Performans sayacı adı
İşlemci(_Total)\% İşlemci Süresi
Bellek\% Kullanılan Kaydedilmiş Bayt Sayısı
Ağ Arabirimi(*)\Toplam Bayt/sn
LogicalDisk(*)\% Boşta Kalma Süresi
LogicalDisk(*)\Ort. Disk Kuyruğu Uzunluğu
Operations Manager işlem genel performans sayaçları

Bu sayaçlar, yönetim sunucusundaki Operations Manager işlemlerinin genel performansını gösterir:

Performans sayacı adı Açıklama
Process(HealthService)\% İşlemci Süresi
Process(HealthService)\Private Bytes Bu yönetim sunucusunun yönettiği aracı sayısına bağlı olarak, bu sayı değişebilir ve birkaç yüz megabayt olabilir.
Process(HealthService)\İş Parçacığı Sayısı
Process(HealthService)\Virtual Bytes
Process(HealthService)\Working Set
Process(MonitoringHost*)\% İşlemci Süresi
Process(MonitoringHost*)\Private Bytes
Process(MonitoringHost*)\İş Parçacığı Sayısı
Process(MonitoringHost*)\Virtual Bytes
Process(MonitoringHost*)\Working Set
Operations Manager'a özgü performans sayaçları

Bu sayaçlar, yönetim sunucusunda Operations Manager'ın belirli yönlerinin performansını gösteren Operations Manager'a özgü sayaçlardır:

Performans sayacı adı Açıklama
Sistem Durumu Hizmeti\İş Akışı Sayısı Bu yönetim sunucusunda çalışan iş akışlarının sayısı.
Sistem Sağlığı Hizmeti Yönetim Grupları(*)\Etkin Dosya Yüklemeleri Bu yönetim sunucusunun işlemekte olduğu dosya aktarımlarının sayısı. Bu, aracılara yüklenen yönetim paketi dosyalarının sayısını temsil eder. Bu değer uzun süre yüksek bir düzeyde kalırsa ve belirli bir anda içeri aktarılan çok fazla yönetim paketi yoksa, bu koşullar dosya aktarımını etkileyen bir sorun oluşturabilir.
Sistem Sağlığı Hizmeti Yönetim Grupları(*)\Kuyruk %'sini Gönder Kullanıldı Kalıcı kuyruğun boyutu. Bu değer uzun süre 10'dan yüksek kalırsa ve düşmezse kuyruğun yedeklendiğini gösterir. Operations Manager sistemi (örneğin, kök yönetim sunucusu) çok meşgul veya çevrimdışı olduğundan, bu koşul aşırı yüklenmiş bir Operations Manager sisteminden kaynaklanır.
Sistem Sağlığı Hizmeti Yönetim Grupları(*)\Bağlama Veri Kaynağı Öğesi Bırakma Oranı Veritabanı veya veri ambarı veri toplama yazma eylemleri için yönetim sunucusu tarafından bırakılan veri öğelerinin sayısı. Bu sayaç değeri olmadığında 0, yönetim sunucusu veya veritabanı, gelen veri öğesini yeterince hızlı işleyemediğinden veya bir veri öğesi patlaması oluştuğundan aşırı yüklenir. Bırakılan veri öğeleri aracılar tarafından yeniden oluşturulacaktır. Aşırı yükleme veya ani artış durumu tamamlandıktan sonra bu veri öğeleri veritabanına veya veri ambarı'na eklenir.
Sistem Sağlığı Hizmeti Yönetim Grupları(*)\Veri Kaynağı Öğesi Bağlama Gelen Oranı Veritabanı veya veri ambarı veri toplama yazma eylemleri için yönetim sunucusu tarafından alınan veri öğelerinin sayısı.
Sistem Sağlığı Hizmeti Yönetim Grupları(*)\Bağlama Veri Kaynağı Öğesi Deftere Nakl. Veri toplama yazma eylemleri için yönetim sunucusunun veritabanına veya veri ambarı'na yazdığı veri öğelerinin sayısı.
OpsMgr Bağlayıcısı\Alınan Bayt Sayısı Yönetim sunucusu tarafından alınan ağ baytlarının sayısı; yani, sıkıştırmadan önce gelen baytların boyutu.
OpsMgr Bağlayıcısı\İletilen Bayt Sayısı Yönetim sunucusu tarafından gönderilen ağ baytlarının sayısı, yani sıkıştırmadan sonra giden baytların boyutu.
OpsMgr Bağlayıcısı\Alınan Veri Baytları Yönetim sunucusu tarafından alınan veri baytlarının sayısı; yani, sıkıştırmadan sonra gelen verilerin boyutu.
OpsMgr Bağlayıcısı\İletilen Veri Baytları Yönetim sunucusu tarafından gönderilen veri baytlarının sayısı; yani sıkıştırmadan önce giden verilerin boyutu.
OpsMgr Connector\Open Connections Yönetim sunucusunda açık olan bağlantı sayısı. Doğrudan bağlı olan aracıların veya kök yönetim sunucusunun sayısıyla aynı olmalıdır.
OpsMgr veritabanı Yazma Eylemi Modülleri(*)\Ort. Toplu İş Boyutu Veritabanı yazma eylemi modülleri tarafından alınan veri öğelerinin veya toplu işlemlerin sayısı. Bu sayı 5.000 ise bir veri öğesi patlaması gerçekleşir.
OpsMgr DB Yazma Eylemi Modülleri(*)\Ort. İşlem Süresi Bir veritabanı yazma eylemi modülünün veritabanına toplu iş eklemek için aldığı saniye sayısı. Bu sayı genellikle 60'tan büyükse veritabanı ekleme performansı sorunu oluşur.
OpsMgr DW Yazıcı Modülü(*)\Ort. Toplu İşlem Zamanı, ms Veri ambarı yazma eylemi için bir veri ambarı içine bir grup veri öğesi eklemek için milisaniye sayısı.
OpsMgr DW Yazıcı Modülü(*)\Ort. Toplu İş Boyutu Veri ambarı yazma eylemi modülleri tarafından alınan ortalama veri öğesi veya toplu işlem sayısı.
OpsMgr DW Yazıcı Modülü(*)\Batches/sn Veri ambarı yazma eylemi modülleri tarafından saniye başına alınan toplu işlemlerin sayısı.
OpsMgr DW Yazıcı Modülü(*)\Veri Öğeleri/sn Saniyedeki veri ambarı yazma eylemi modülleri tarafından alınan veri öğelerinin sayısı.
OpsMgr DW Yazıcı Modülü(*)\Bırakılan Veri Öğesi Sayısı Veri ambarı yazma eylemi modülleri tarafından bırakılan veri öğelerinin sayısı.
OpsMgr DW Yazıcı Modülü(*)\Toplam Hata Sayısı Veri ambarı yazma eylemi modülünde oluşan hata sayısı.