Automaticky restart kritických služeb

Po dnešním výpadku jsem doprogramoval sadu scriptů pro automatickou kontrolu funkčnosti některých kritických služeb. Konkrétně se jedná o služby Dovecot (POP3 a IMAP), Apache (HTTP), MySQL a Postfix (SMTP).

Servery mají uptime kolem 2 roků a tento neplánovaný výpadek služby vidím jako velice, ale opravdu velice nahodilou situaci.

Aby se toto neopakovalo, testuje se každou hodinu dostupnost těchto služeb a v případě, že některá z nich neběží je automaticky spuštěna. To znamená, že nejpozději do hodiny je daná služba opět funkční.

Je mi jasné, že okamžitě kdejakého šťourala napadne, proč se dostupnost služeb netestuje každých 5 minut, nebo každou minutu. Technicky to samozřejmě není problém, ale vzhledem k tomu, co vše na serverech běží jsem nechtěl servery zatěžovat dalšími jen kontrolními mechanismy. Myslím si, že když pošta dorazí do hodiny, není to až tak velký problém. A nevěřím nikomu co tvrdí, že problém to je.

Věřte mi, o poštovní servery se starám více než 10 let 🙂