監視サーバがインターネット経由で HTTP や POP などを監視。 また、内部監視エージェントがサーバ内のサービス稼働状況を監視し、監視サーバに報告します。


1 サーバあたり、最大で 25 項目までの監視が可能です ( 26 項目以上をご希望の場合はご相談ください ) 。
ネットワークの稼働状況を監視します。疎通ができない場合は障害通知メールを送信します。
| 監視方法 | 標準閾値 |
|---|---|
| ping による | パケットロス 60% 以上 または RTT ( Round Trip Time ) 1000ms 以上 |
監視対象ポートへのコマンド送受信によって、サービスの応答状況をサーバ外部から、または監視エージェント経由で監視します。15分ごとの監視サーバ巡回時に異常な応答があった場合や応答がなくタイムアウト ( HTTP・SMTP・POP は 60秒、それ以外は 30秒 ) した場合に障害通知メールを送信します。
例えば、サーバが停止して一切の疎通が確認できない場合や、一時的にウェブサーバへのアクセスが集中して応答がしづらい状況を通知することができます。
HTTP ・ HTTPS ・ POP ・ SMTP ・ DNS ・ FTP ・ SSH ・ TELNET ・ メールの不正中継
| ポート | サービス | 監視方法 | |
|---|---|---|---|
| サーバウォッチ の動作 | 利用中のサーバ動作 | ||
| 21 | FTP | $ telnet 「 お客さまサーバ 」 21 | |
| < 220 ・・・ | |||
| > quit | |||
| 25 | SMTP | $ telnet 「 お客さまサーバ 」 25 | |
| < 220 ・・・ | |||
| > quit | |||
| 53 | DNS | $ nslookup - type = A 「 127.0.0.1 」 「 127.0.0.1 」 |
|
| 80 | HTTP | $ telnet 「 お客さまサーバ 」 80 | |
| > GET / HTTP / 1.1 | |||
| > Host : $HOST:80 | |||
| < HTTP / 1.1 200 OK | |||
| 110 | POP3 | $ telnet 「 お客さまサーバ 」 110 | |
| < +OK ・・・ | |||
| > QUIT | |||
| 443 | HTTPS | http クライアントによるアクセス | |
| 25 | OpenRelay ( 不正中継 ) の操作 |
$ telnet 「 お客さまサーバ 」 25 | |
| < 220 ***.at-link.ad.jp ESMTP Sendmail 8.13.1 |
|||
| > HELO ***.at-link.ad.jp | |||
| < 250 ***.at-link.ad.jp Hello ***.at-link.ad.jp [xxx.xxx.xxx.xxx] |
|||
| > MAIL FROM: < RelayCheck@***.at-link.ad.jp> |
|||
| < 250 2.1.0 < RelayCheck@***.at-link.ad.jp > ... Sender ok | |||
| > RCPT TO: < RelayCheck@at-link.ad.jp> |
|||
| < 553 5.7.1 ... Relay operation rejected | |||
| < 221 2.0.0 ***.at-link.ad.jp closing connection | |||
| > QUIT | |||
サーバ内部にプロセスが存在しているかを監視します。15分ごとの監視サーバ巡回時にプロセスが立ち上がっていない場合や 30 秒間応答がなくタイムアウトした場合に障害通知メールを送信します。
PostgreSQL ・ MySQL ・ Oracle 各 DB のプロセス ・ cron ・ お客さま指定プロセス
| プロセス | 監視方法 | |
|---|---|---|
| Linux | Windows | |
| PostgreSQL | ps による | プロセスリスト取得による |
| MySQL | ||
| Oracle | ||
| その他 | ||
内部の CPU 負荷・ディスク使用率・メモリ使用率や Swap 領域の使用状況を監視します。15分ごとの監視サーバ巡回時に設定されている閾値を超えた場合や 30 秒間応答がなくタイムアウトした場合に障害通知メールを送信します。
| リソース | 標準閾値 | |||
|---|---|---|---|---|
| Linux | Windows | |||
| CPU | Load Average | 10 以上 | 10 分間の平均負荷 | 80 % 以上 |
| メモリ | SWAP 使用率 | 80 % 以上 | 総メモリ使用率 ( 物理メモリ・ 仮想メモリ ) |
|
| ディスク | パーティション毎の 使用率 |
90 % 以上 | ドライブ毎の 使用率 |
|
オプションでより高度な監視が可能です。
各項目の設定数が合計10までであれば、いくつ設定しても料金は変わりません。10以上になる場合はご相談ください。
例:ログ監視で 5つのログを監視し、URL監視で1つのURLを監視する場合は、合計 6 とカウントします。
帯域の使用量 ( トラフィック ) 増加を把握することができます。 指定された帯域を超えた場合に通知します。
出力される HTML を定期的に確認し、指定した文字列が無い場合に障害通知メールを送信します。
コンテンツの誤削除や変更、DB から出力される文字列の監視やシステム全体の正常性など、工夫次第でさまざまな監視ができます。
※ スペースを含む文字列の監視も可能です。
指定された URL にアクセスし、コンテンツが正しく表示されるかどうかを監視します。 サーバエラー・タイムアウト等のエラー発生時に障害通知メールを送信します。監視対象は、ホスト名やポート番号 ・ URL が指定できます。バーチャルドメインを使用している場合や、特定の URL への監視に便利です。
指定されたファイルがサーバ内に存在しているかどうかを監視します。存在していない場合に障害通知メールを送信します。
/var/log 以下にあるログファイルや各種アクセスログ、プロセス ID ファイルやデータベースに関わるファイルが存在しているかどうかを監視することができます。
※ URL 監視が外からのコンテンツ状況の確認であるのに対し、ファイル存在監視はサーバ内からの監視となります。
iptables の iptable_filter など、指定されたモジュールが正常にロードされているかどうかを確認することができます。 モジュールが正常に組み込まれていない場合に、障害通知メールを送信します。サーバの再起動後など、本来読み込むべきモジュールがない場合に通知されます。
ログファイルの文字列を監視します。DB のエラー発生など、異常を検出する文字列が出力された場合に障害通知メールを送信します。
お客さまサイドで用意された監視スクリプトをサーバに組み込むことで、様々な監視が可能となります。 プロセス監視ではカバーできない DB の応答や、お客さま独自のプロセス状況などが監視できるようになります。 ご希望の場合は オリジナル監視仕様 に基づきスクリプトを作成し、ご依頼ください。
障害を検知した際 ( イベントの発生時 ) に、任意のコマンドを自動実行します。例えば、PostgreSQL の停止を検出すると、そのプロセスを起動するコマンドを自動実行します。コマンドは、予めお客さまにご指示いただきます。
サーバの稼働状況や障害発生状況のレポートをお客さまに定期的に送信します。
レポートの頻度は、月次送信 ( 月次リポートサンプル )・週次送信 ( 週次リポートサンプル ) から選択可能です。
一次対応付きは、手順書に基づいた障害対応を行います。
障害対応手順をご指示ください。コマンドの実行・ブラウザ確認も可能ですので、都度ご相談ください。
ご用意いただく手順書に基づく、障害 1 回あたりの作業量の目安は次のとおりです。コマンド数が多くなる場合は、復旧手順をまとめたスクリプトの作成をお願いしております。
| コマンド・手順数 | 10 回まで ( ブラウザ確認等含む ) |
|---|