Uptime Robot、障害発生時のWeb Hook通知機能

タグ: 海外サーバー   その他  

サイトモニタリングサービスはたくさん存在しています。現在はそれらのほとんどが、APIを提供しています。たいていのサービスではメールで状態の変化を通知してくれます。

その中でも無料で、しかもサイトの状態が変化したら、指定したURLへアクセスして通知してくれるサービスがあります。Uptime Robotです。

モニタリングサービスも競争が激しく、昔ほど見かけなくなりました。このサービスは古いほうだと思います。随分前に試しましたが、他のサービスのほうが良質だったので、使っていませんでした。

あるとき、サイトのデザインが変更になるとのメールが来て、使用を再開しました。なにせ50サイトまで使用できますからね。

最近、Web Hook通知が増えたというメールがきました。これが「状態変化」があったら、指定したURLへ通知してくれる機能です。

サイトを監視し、障害時の対応を自動化しようとするなら、別のサーバーが必要になります。(高くてもAWSが便利なのは、ここらへんの仕組みが整っていて、柔軟性があるからですね。)

そのサーバーから、監視対象にアクセスして、状態を把握します。もしくは、モニタリングサービスにアクセスして、そこで管理されている情報を元に、制御を行うことになります。一定時間ごとに監視ですと、多少手間がかかります。

障害発生時だけ、通知してくれれば、仕組みを簡単にできます。ですから、push型の通知を無料で提供してくれるUptime Robotはありがたい存在です。

基本的な使用方法については、既に日本語で紹介記事が書かれています。ご覧ください。

この記事はWeb Hook通知が提供される前らしく、記述はありません。"My Setting"から、"Add Alert Contact"ボタンをクリックすると、URLが指定できるようになります。通知される内容の説明も書かれています。

この通知を指定したURLで受け、サイトと状態を確認し、必要に応じてバックアップサイトに切り替えたり、サーバーの再起動APIを叩いたりします。

注意点は、監視対象のサイトが起動・障害を繰り返す場合があることでしょう。例えば、そのたびごとにバックアップサイトのVPSインスタンスを起動したのでは、下手をすれば複数インスタンスができてしまったり、起動・破壊ごとのコストが余計にかかってしまうこともあるでしょう。

短いサイクルの起動・障害を考慮するために、モニタリング時間をあえて伸ばしたり、自動処理をうまく制御したりする工夫は必要でしょう。Uptime Robotは無料の場合、最短監視感覚は5分ですが、一度障害が起きてから復帰するまでの間は、もうちょっと細かくチェックしている可能性があり、ダウンタイムが1分とか2分とか、5の倍数ではない時間で通知されます。