少し技術的な日記です。専門用語は控えるつもりですが興味のない方はスルー推奨です。
今朝のことです。
日課のサーバの状態確認をしていると、問題がみつかりました。
津山瓦版は機能別に分けられた数台のサーバ群で構成されているのですが、そのうちの重要な機能を持つ1台において、記憶装置(ハードディスクドライブ)の故障を確認しました。
幸い2台の記憶装置を組み合わせて、1台が故障しても他で縮退運転が可能になるように設計しており、故障しながらもサービスを継続できています。(データも失われません)
これが備え1つ目。
とはいえこのままでは残りの記憶装置が故障するとデータが失われてしまいますので、緊急メンテナンスを行い、故障した記憶装置を新品と交換することを決定しました。
ここからが本番で、この操作自体は難しいものではないのですが、ちょっとしたミスで残っているデータを破壊したり、消去してしまうリスクがあります。
知人が同様のトラブルで、稼働中の記憶装置から新品の記憶装置に同期しなくてはならなかったのに、うっかり逆に新品の方に同期してしまいすべてのデータが消えてしまった、と言ってました((((;゚Д゚))))ガクガクブルブル
ここで備え2つ目が効いてきます。
津山瓦版では、大事なデータを失うことのないよう、上記の記憶装置の複数台構成に加えて、毎日決まった時刻に遠隔地にあるデータ保存先へバックアップデータを転送しています。(遠隔地のサーバに転送するため、例えば自然災害で津山瓦版のサーバが失われても復旧することは可能です)
つまりうっかり手元にあるデータを消してしまっても、バックアップから復元することができるわけです。
これによって、ミスを必要以上に恐れず、落ち着いて作業することができます。(ゆっくり急いで!)
以上のような”備え”により、今回も無事にサービスを復旧することができました。
備えというのはそれが必要ないときには無駄に思えるために削減されがちですが、必要なときに無いと大変なことになります。
皆様も重要なデータはしっかりとバックアップしてトラブルに備えましょう。
ちなみに備えの数が多いほどサーバ管理者は安眠できます。
サーバがダウンすれば対応のため出社しなければならないことには変わりありませんが、その後のことを考えるとやはり気が楽なものです。
ストレスによる禿の進行も遅らせることができるでしょう(笑)
コメントする