一般的な Linux と 99.9996% のミッションクリティカルのサポートの差 ― 2006年05月24日 11時54分16秒
24時間365日の安定稼働を実現する上では、もしもの場合のサポートにも万全の体制が求められます。随分、長い引用になってしまったが、このぐらい取っておかないと、何が何だか分からないであろう。
...
9時から21時までの通常のサポートに加えて、21時から朝9時も専門のサポートデスクを用意しました。
...
ミッションクリティカルなシステムの障害は、お客様のビジネスに多大な影響を与える可能性を持っていますが、24時間365日のサポートサービスによって、システムにトラブルが起きた場合の迅速な復旧をサポートしていきます。
...
こうしたお客様の要望に応えるためにテンアートニは、日本IBM、NEC、日本HP、日立製作所、そして富士通という5社のハードウェアベンダーと提携し、OSとハードウェアの障害切り分けサービスを提供しています。テンアートニとハードウェアベンダーがRed Hat OSとハードウェアに関する各種の情報を共有することで、お客様のシステムにトラブルが起きた際に、原因がOSにあるのかハードにあるのかの切り分けを行います。
...
これに対してテンアートニが提供する「Red Hat Enterprise Linux Plus」シリーズは、受付時間が4時間延長されており、21時まで電話による問い合わせが可能です。
要約すると、ハードウェアベンダと提携し、他社と比べてサポート時間が多いのが売りである。障害時には迅速な問題の切り分けを手伝い、それから対策である。Linux の企業サポートについては、全く疎いので詳しくは知らないが、この広告を信じると、このサポートも手厚い方みたいだ。この程度で、ミッションクリティカルと呼ぶのだから笑止である。逆の言い方をすれば何か障害があったら止まってしまうわけだ。実質的な Linux の稼働率はどれくらいだろうか。聞いたこともない。99.9% に達することはあるだろうか。
Stratus/VOS でのサポートは以下のようになる。計算機自体が異常を検出すると、正常な部分でのみの運用に自動的に切り替わり、自己診断をする。同時に、Stratus 社に計算機自体が連絡を入れ、Stratus 社から、異常が発生したことが告げられる。そのスピードたるや脅威的なものがある。なにせ、末端に張り付いている人達が気づくよりも早く電話が入ってくる位なのだ。なお、これらの異常自体は、sys_err_log に記録される。もちろん自前で、ころログファイルを監視をするが、残念ながら特定のエラーを探すことになる。別の言い方をすると、経験した障害しか自前では監視できないわけだ。Stratus 社はもちろん自社で開発したので、どのログが重大な障害かは良く分かっている。
さて、この電話が入ってくるときには大体、結果は既に出ている。機械がほぼ全て二重化されて、全ての結果を比較し、常に異常の自己診断をしている。そのため、万が一でも不一致が検出されると、不良部分が自動的に切り離され、自己診断に入る。そして、自己診断で異常がないことが確認されると、また、冗長な運用に戻る。言うまでもないとは思うが、この間には一切の遅延は発生しない。
よく PC Unix では「なぜかシステムが急に停止する。しかも、停止する時の規則性がないがどうしたものだろう。」といった事は時おり耳にする。そのような時は、memtestをやったら、異常が出てきたというのがいつもの落ちである。Stratus では急に CPU がおかしくなっても、何も問題が起きないのだ。
なお、経験上、ほとんどの自己診断の結果は異常がないと出るみたいだ。Stratus 社から電話が入り異常は無く通常運用に戻ったことを告げられる。それでも、不安な場合は、交換部品を送ってもらって付け替えるわけである。
残念ながら、Stratus 機上で他の OS は使ったことは無いので、他の OS でもまったく同じようなレベルでのサポートをしているのかは定かではない。しかし、この様な操作の大部分はハードウェアで実装されている。そのことを踏まえると、他のベンダーよりは堅固なサポート体制は敷いていると思う。
最初は Stratus も随分手の込んだことをやるなとは思ったが、やはりこれくらい徹底しないと、本当のミッションクリティカルは実現できないらしい。Sun の営業も手も足も出ないと言うわけだ。そういう意味では *BSD 系の弱さはサポートかも知れない。Linux では流行もあって大手企業等もこうして、曲がり形(な)りにもサポート体制を敷いている企業はある。そもそも、FreeBSD でさえ大体的にサポートを宣伝しているところなどあるのだろうか。
最近のコメント