インターネットサーバーを運用し始めると、監視業務という重要な運用ミッションが発生します。
この業務を怠ると、トラブル時の被害が甚大になる可能性が高くなるので、疎かにできないミッションであることは間違いないでしょう。
ただし、この「監視」という事をどういうところに気をつけて、どんなことをやれば良いのか、分からない人も多いエンジニアも少なくないという事が実態で、企業でも課題になっている案件の一つでもあるようです。
サーバー監視は何をすればいいの?
サーバー監視で重要なポイントは以下の3つです
1. サーバー、サービスが正常に稼働しているか
2. サーバー機器の負荷が高くなっていないか
3. ネットワークが正常に作業しているか
それぞれ、簡単に説明すると以下のような内容になっています。
1. サーバー、サービスが正常に稼働しているか
「死活監視」と言われるモノで、サーバー監視の基本中の基本です。
外部機器から対象のサーバーに対してpingを打ち続ける事でサーバー監視はできますが、サービス監視は、範囲が広く、サービスが正常に動作しているという事を、アプリケーション自信で監視する方法と、PC端末のブラウザなどから起動してみて、確認する方法などがあります。
ただし、監視サービスは手作業で行うことはあまり望ましくなく、いかに自動化できるかが、仕事で行う際のポイントになります。
2. サーバー機器の負荷が高くなっていないか
「ヘルスチェック」と言われて、サーバー機器が内部処理や、アクセス過多などにより性能劣化を起こしていないか確認をする。
「閾値監視」という風な考え方もあります。
機器間死は、上位ネットワークやスイッチなどのアプリケーション・サーバーではない機器、OSを持たない機器などに対して有効で、サービスという全体構成図の内部の機器を全て監視するのが対象である事が条件になります。
3. ネットワークが正常に作業しているか
WEBサーバーという事で「ネットワーク監視」は非常に重要です。
ネットワーク監視の領域は、トラフィック状況から、回線の疎通状況など、目に見えにくい状況を把握することが目的です。
障害発生の時に一番検知しづらいのが、ネットワーク監視かもしれません。
それは、自分の管理できる領域外で発生した障害が検知しづらいという理由ですね。
何故サーバー監視が必要なのか?
当たり前ですが、WEBサービスを提供する場合、主となるサーバー機器が存在して、そのサーバーや回線が正常に動作しなければサービスが起動すらしないというモノが一般的なため、監視をしていないと、自分の運用しているサービスが正常に使えているか使えていないかが把握できずに、その結果品質に影響してくる為、監視はWEBサービス提供において、重要な品質管理の一貫であるためです。
どのレベルのサーバー監視が必要なのか?
AmazonのS3がイレブン・ナイン(99.999999999%)というサービス正常稼働を実績として表していて、コレを聞いたネットワーク管理者やサーバー管理者は、非常に品質が高いという印象を持ちます。
もちろん、管理者ではなく、利用するユーザーにおいても、こうした実績を見るとサービスに対する安心感を持てるので、企業において重要な品質値として扱われています。
正常稼働値の計算方法
単位を年間にするのが、一般的なのですが、1年のうちに正常かどうしていた時間の割合になります。
ちなみに、1年間で24時間サーバーがダウンする障害が発生してしまうと、
1時間 ÷ 365日 ✕ 24時間 = 0.000114155251142 (0.01%)
計算式は意外と単純で下記のようになります。
障害時間数 ÷ 総時間数 ✕ 100 (%)
年間障害率の1%
ちなみに、正常稼働率99%となると、1%の障害率という事で、それに該当する時間は87.6時間という事になります。
大体4日弱の障害で1%ダウンしてしまうという事です。
※計算式
365日 ✕ 24時間 ÷ 100(時間)
クラウド業者の正常稼働率は信用できる?
Amazonの障害時間は「-0.0000000876」時間という事になり、ナノ秒レベルという風に見えますね。
ただし、色々なからくりがあり、障害時間をサーバー台数などで平均化されていた場合、サーバー台数が多いほど、値が下がる為、クラウド業者のこの値はどのレベルで参考になるかは正直疑問ですね。
お気軽に始められるサーバー監視サービス(無料)
WEBサービスを監視するためのWEBサービスが最近は沢山出てきていて、非常に便利な世の中になったと思います。
そしてさらに、無料で監視を行なってくれるサービスも存在するので、使わないと損というよりは、知っておかないと損だと思います。
1. CMAN
https://www.cman.jp/network/
監視するサーバー側でソフトウェアのインストールなどが不要の為、死活監視を行うことが可能です。
商用利用も可能なので、便利にお使いください。
2. SavaMoni.
https://savamoni.com/
手軽に死活監視が出来る上、専用のサーバーモジュールをインストールすると、より詳細な監視ができるます。
障害発生時にメールにお知らせをしてくれる機能など、管理者に嬉しい機能になっていて非常に便利です。
3. SiteRock
無料サーバー監視サービス | Site Care FREE Ⅱ
DNS監視や、任意ポート監視まで行なってくれる非常に高機能無料監視サービスです。
サーバーへのモジュールインストールなども不要なので、是非使わないと損レベルでしょう。
4. SECURE ST☆R
フリープラン | SECURE ST☆R
GMOの運用する監視サービスのようです。
正直使っていないんですが、内容を見た限りでは、単一監視であれば、比較的安定な監視を行なってくれそうです。
メール報告のみと書かれているので、有料プランへの乗り換えが目的のように見えますが、商用サービスだと厳しいかもしれませんね。
5. パトロールクラリス
パトロールクラリス
監視の機能がフリー版は圧倒的に少ないサービスですが、有料版を企業で使うのであれば、非常に良さそうなサービスです。
個人のサーバーであれば無料でいいと思いますが、このレベルであればping叩くぐらいで十分でしょう。
Cloud Doctor
Cloud Doctor
アカウント登録をしてURLを入力するだけで、監視ができてしまうサービスです。
クラウドと名称につけるところが、今風をかもし出していてニクイですねえ。
ユニークな機能としてログイン監視というのがあります。
管理画面系の監視にどうぞ。
ほかにもあります
サーバー無料監視サービスは結構たくさんあるようですね。
無料でサーバー監視を提供してくれるサービス
すでに終了したサービスもあるようですが、中々のレッドオーシャンのようです。
OSSで自分でも簡単にできる
サーバー管理者であれば、下記のようなOSSを使って自前で監視することをオススメします。
zabbix
http://www.zabbix.com/jp/
munin
http://munin-monitoring.org/
nagios
https://ja.wikipedia.org/wiki/Nagios
サーバー監視はつらいよ
WEBサーバーは、365日24時間運用を行わないと意味がありません。
そのため、企業では、夜間対応などに追われる場合も多く、管理者の人からは、非常にブラックな仕事として捉えられている印象もあります。
しかし、こうした監視業務などは、ある程度自動化出来るため、エンジニアスキルに安定性が依存する事は間違いないでしょう。
ソフトウェアの障害もサーバー負荷が高くなれば、サーバー管理者の監視対象になってしまうため、フロントからバックエンドまでの知識を要求される場合も多く、ここにモチベーションがない場合は正直厳しい作業になるかもしれません。
フルスタックエンジニア万歳!!
0 件のコメント:
コメントを投稿