Dedicated sunucularda güç kaynağı (power supply) failover testi, sistem kesintisizliğinin kritik bir parçasıdır.
Dedicated sunucularda güç kaynağı (power supply) failover testi, sistem kesintisizliğinin kritik bir parçasıdır. Kurumsal ortamlarınızda yüksek erişilebilirlik hedefliyorsanız, redundant güç kaynağı birimlerinin (PSU) sorunsuz geçişini doğrulamak zorunludur. Bu test, bir PSU arızalandığında diğerinin otomatik olarak devreye girip sunucuyu ayakta tutmasını simüle eder. Özellikle veri merkezlerinde çalışan IT yöneticileri için, bu işlem downtime riskini minimize eder ve SLA uyumluluğunu sağlar. Makalede, adım adım hazırlık, uygulama ve değerlendirme süreçlerini ele alacağız; böylece kendi dedicated sunucularınızda güvenle uygulayabilirsiniz.
Dedicated sunucularda power supply failover, çift PSU konfigürasyonuyla sağlanır. Birincil PSU ana yükü taşırken, ikincil PSU yedek olarak bekler. Failover mekanizması, donanım seviyesinde (örneğin, anakart sensörleri aracılığıyla) çalışır ve güç kaybını milisaniyeler içinde algılayarak geçiş yapar. Bu sistem, sunucunun tamamen kapanmasını önler ve iş sürekliliğini korur. Test etmek, konfigürasyon hatalarını veya kablo bağlantı sorunlarını erken tespit etmenizi sağlar.
Kurumsal düzeyde, failover testi düzenli bakımın parçası olmalıdır. Örneğin, Dell PowerEdge veya HPE ProLiant gibi sunucularda iDRAC veya iLO gibi yönetim arayüzleri üzerinden PSU durumunu izleyebilirsiniz. Test öncesi, sunucunun tam yük altında çalışması önerilir ki failover gerçekçi olsun. Bu yaklaşım, potansiyel termal veya yük dengesizliği sorunlarını da ortaya çıkarır.
Failover sistemi, PSU’lar arası senkronizasyon, güç dağıtım panelleri ve anakart BMC’sinden oluşur. Her PSU bağımsız girişe sahip olmalı; idealde farklı PDU’lara bağlıdır. Sensörler, voltaj düşüşünü %5’in altında algılar ve geçişi tetikler. Pratikte, bir PSU’yu fişten çekerek testi manuel simüle edebilirsiniz, ancak otomatik araçlar daha güvenlidir.
Yedekli PSU’lar, %99.999 uptime sağlar ve yıllık downtime’ı dakikalara indirir. Maliyet etkin bir çözüm olup, donanım arızalarında veri kaybını önler. Testlerle, failover süresini 50 ms altına çekerek optimize edebilirsiniz; bu, VoIP veya finansal uygulamalar için kritiktir.
Test öncesi hazırlık, riskleri en aza indirir. Öncelikle, sunucuyu tam kapasiteye yükleyin: CPU %80+, RAM ve disk I/O yoğunluğuyla. Bu, failover sırasında gerçek yükü simüle eder. PDU’ları ayrı devrelere bağlayın ki test bir PDU’yu etkilemesin. iDRAC gibi araçlarla PSU sıcaklıklarını (max 60°C) ve fan hızlarını izleyin.
Güvenlik için, test saatlerini planlayın ve ekip bildirimleri kurun. Elektrik kesintisi simülasyonu yerine fiziksel PSU çıkarma tercih edin; bu, kısa süreli kesinti yaratmaz.
Kabloları çift kontrol edin: Her PSU ayrı AC hattına bağlı olsun. PSU LED’lerini inceleyin (yeşil=normal, sarı=uyarı). Voltajı multimetre ile ölçün (örneğin, 220V ±%10). Sunucu rack’inde hava akışını sağlayın ki failover termal sorun yaratmasın. Bu adımlar, %95 başarı oranını garantiler.
IPMItool veya Supermicro IPMI ile PSU durumunu sorgulayın: ipmitool sensor list | grep PSU. Grafana entegrasyonuyla gerçek zamanlı grafikler oluşturun. Test sırasında logları syslog’a yönlendirin ki analiz kolaylaşsın. Bu araçlar, failover gecikmesini hassas ölçer.
Testi uygulamak için, sunucuyu yük altında çalıştırın. Birincil PSU’yu yavaşça fişten çekin; ikincil devreye girmeli. Ping testiyle kesinti süresini ölçün (hedef: <100ms). Loglarda “PSU failover event” arayın. Tekrar PSU’yu takıp tersini test edin. Tüm süreç 15-30 dakika sürer.
Sonuçları analiz ederken, downtime metriğini hesaplayın: Toplam kesinti / test sayısı. Başarısızsa, kabloyu veya firmware’i kontrol edin. Düzenli testlerle (aylık), performansı iyileştirin. Örnek: Bir testte 20ms failover ile %100 başarı elde edildiğinde, sistemi production’a güvenle bırakın.
1. Yükü simüle edin (stress-ng ile). 2. iDRAC’ten PSU1’i izleyin. 3. PSU1’i çıkarın, logları takip edin. 4. 5 dakika bekleyin, takın. 5. PSU2 testi tekrarlayın. Her adımda uptime’ı doğrulayın. Bu prosedür, standartlaştırılmış ve tekrarlanabilir.
Yaygın sorun: Dengesiz yük dağılımı – BIOS’ta balance modunu açın. Uzun failover (500ms+): Fanları temizleyin. Log hatası: Firmware güncellemesi yapın. Bu çözümlerle, testi %99 başarıya ulaştırın ve raporlayın.
Sonuç olarak, dedicated sunucuda power supply failover testi, proaktif bakımın temel taşıdır. Düzenli uygulama ile sistem güvenilirliğinizi artırır, beklenmedik arızalara karşı hazırlıklı olursunuz. IT ekibinizi eğitin ve otomasyon scriptleri geliştirin ki bu süreç rutinleşsin. Bu şekilde, kurumsal altyapınız kesintisiz çalışmaya devam eder.