SQL Server ile IaaS - yük devretme kümesi ağ eşiklerini ayarlama
Bu makalede yük devretme kümesi ağlarının eşiğini ayarlamaya yönelik çözümler sunulur.
Belirti
IaaS'de Sql Server AlwaysOn kullanılabilirlik grubuyla Windows yük devretme kümesi düğümlerini çalıştırdığınızda, küme ayarının daha rahat bir izleme durumuna değiştirilmesi önerilir. Kutudan çıkan küme ayarları kısıtlayıcıdır ve gereksiz kesintilere neden olabilir. Varsayılan ayarlar, yüksek oranda ayarlanmış şirket içi ağlar için tasarlanmıştır ve Microsoft Azure (IaaS) gibi çok kiracılı bir ortamdan kaynaklanan gecikme olasılığını dikkate almaz.
Windows Server Yük Devretme Kümelemesi, bir Windows Kümesindeki düğümlerin ağ bağlantılarını ve sistem durumunu sürekli izler. Bir düğüme ağ üzerinden ulaşılamıyorsa, uygulamaları ve hizmetleri kümedeki başka bir düğümde kurtarmak ve çevrimiçi duruma getirmek için kurtarma eylemi gerçekleştirilir. Küme düğümleri arasındaki iletişim gecikmesi aşağıdaki hataya neden olabilir:
Hata 1135 (sistem olay günlüğü)
Küme düğümü Düğüm 1 etkin yük devretme kümesi üyeliğinden kaldırıldı. Bu düğümdeki Küme hizmeti durmuş olabilir. Bunun nedeni düğümün yük devretme kümesindeki diğer etkin düğümlerle iletişimi kaybetmesi de olabilir. Ağ yapılandırmanızı denetlemek için Yapılandırma doğrulama sihirbazını çalıştırın. Koşul devam ederse, bu düğümdeki ağ bağdaştırıcılarıyla ilgili donanım veya yazılım hatalarını denetleyin. Ayrıca hub'lar, anahtarlar veya köprüler gibi düğümün bağlı olduğu diğer ağ bileşenlerindeki hataları denetleyin.
Cluster.log örnek:
0000ab34.00004e64::2014/06/10-07:54:34.099 DBG [NETFTAPI] Signaled NetftRemoteUnreachable event, local address 10.xx.x.xxx:3343 remote address 10.x.xx.xx:3343
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO [IM] got event: Remote endpoint 10.xx.xx.xxx:~3343~ unreachable from 10.xx.x.xx:~3343~
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO [IM] Marking Route from 10.xxx.xxx.xxxx:~3343~ to 10.xxx.xx.xxxx:~3343~ as down
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO [NDP] Checking to see if all routes for route (virtual) local fexx::xxx:5dxx:xxxx:3xxx:~0~ to remote xxx::cxxx:xxxd:xxx:dxxx:~0~ are down
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO [NDP] All routes for route (virtual) local fxxx::xxxx:5xxx:xxxx:3xxx:~0~ to remote fexx::xxxx:xxxx:xxxx:xxxx:~0~ are down
0000ab34.00007328::2014/06/10-07:54:34.099 INFO [CORE] Node 8: executing node 12 failed handlers on a dedicated thread
0000ab34.00007328::2014/06/10-07:54:34.099 INFO [NODE] Node 8: Cleaning up connections for n12.
0000ab34.00007328::2014/06/10-07:54:34.099 INFO [Nodename] Clearing 0 unsent and 15 unacknowledged messages.
0000ab34.00007328::2014/06/10-07:54:34.099 INFO [NODE] Node 8: n12 node object is closing its connections
0000ab34.00008b68::2014/06/10-07:54:34.099 INFO [DCM] HandleNetftRemoteRouteChange
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO [IM] Route history 1: Old: 05.936, Message: Response, Route sequence: 150415, Received sequence: 150415, Heartbeats counter/threshold: 5/5, Error: Success, NtStatus: 0 Timestamp: 2014/06/10-07:54:28.000, Ticks since last sending: 4
0000ab34.00007328::2014/06/10-07:54:34.099 INFO [NODE] Node 8: closing n12 node object channels
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO [IM] Route history 2: Old: 06.434, Message: Request, Route sequence: 150414, Received sequence: 150402, Heartbeats counter/threshold: 5/5, Error: Success, NtStatus: 0 Timestamp: 2014/06/10-07:54:27.665, Ticks since last sending: 36
0000ab34.0000a8ac::2014/06/10-07:54:34.099 INFO [DCM] HandleRequest: dcm/netftRouteChange
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO [IM] Route history 3: Old: 06.934, Message: Response, Route sequence: 150414, Received sequence: 150414, Heartbeats counter/threshold: 5/5, Error: Success, NtStatus: 0 Timestamp: 2014/06/10-07:54:27.165, Ticks since last sending: 4
0000ab34.00004b38::2014/06/10-07:54:34.099 INFO [IM] Route history 4: Old: 07.434, Message: Request, Route sequence: 150413, Received sequence: 150401, Heartbeats counter/threshold: 5/5, Error: Success, NtStatus: 0 Timestamp: 2014/06/10-07:54:26.664, Ticks since last sending: 36
0000ab34.00007328::2014/06/10-07:54:34.100 INFO <realLocal>10.xxx.xx.xxx:~3343~</realLocal>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO <realRemote>10.xxx.xx.xxx:~3343~</realRemote>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO <virtualLocal>fexx::xxxx:xxxx:xxxx:xxxx:~0~</virtualLocal>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO <virtualRemote>fexx::xxxx:xxxx:xxxx:xxxx:~0~</virtualRemote>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO <Delay>1000</Delay>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO <Threshold>5</Threshold>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO <Priority>140481</Priority>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO <Attributes>2147483649</Attributes>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO </struct mscs::FaultTolerantRoute>
0000ab34.00007328::2014/06/10-07:54:34.100 INFO removed
0000ab34.0000a7c0::2014/06/10-07:54:38.433 ERR [QUORUM] Node 8: Lost quorum (3 4 5 6 7 8)
0000ab34.0000a7c0::2014/06/10-07:54:38.433 ERR [QUORUM] Node 8: goingAway: 0, core.IsServiceShutdown: 0
0000ab34.0000a7c0::2014/06/10-07:54:38.433 ERR lost quorum (status = 5925)
Neden
Kümenin bağlantı durumunu yapılandırmak için kullanılan iki ayar vardır.
Delay - Bu, düğümler arasında küme sinyallerinin gönderilme sıklığını tanımlar. Gecikme, sonraki sinyal gönderilmeden önceki saniye sayısıdır. Aynı kümede, aynı alt ağ üzerindeki düğümler ile farklı alt ağlardaki düğümler arasında farklı gecikmeler olabilir.
Eşik - Bu, küme kurtarma eylemi gerçekleştirmeden önce atlanan sinyal sayısını tanımlar. Eşik, bir dizi sinyaldir. Aynı kümede, aynı alt ağ üzerindeki düğümler ile farklı alt ağlardaki düğümler arasında farklı eşikler olabilir.
Varsayılan olarak, Windows Server SameSubnetThreshold'u 10, SameSubnetDelay'i 1000 ms olarak ayarlar. Örneğin, bağlantı izleme 10 saniye boyunca başarısız olursa yük devretme Eşiğine ulaşılır ve bu düğüme küme üyeliğinden ulaşılamaz duruma gelir. Bu, kaynakların kümedeki başka bir kullanılabilir düğüme taşınmasına neden olur. Küme hataları bildirilir ve küme hatası 1135 (yukarıdaki) bildirilir.
Çözüm
Bu sorunu çözmek için Küme ağı yapılandırma ayarlarını gevşetin. Bkz. Sinyal ve eşik.
Başvurular
Windows Kümesi ağ yapılandırma ayarlarını ayarlama hakkında daha fazla bilgi için bkz . Yük Devretme Kümesi Ağ Eşiklerini Ayarlama.
Windows Kümesi ağ yapılandırma ayarlarını ayarlamak için cluster.exe kullanma hakkında bilgi için bkz. Yük Devretme Kümesi için Küme Ağlarını Yapılandırma.