ファイルシステムの日々の運用課題
システム管理のつぼ(2018年8月号)
システム設計部 利波 健二
Linuxのシステムを運用するにあたって、様々な監視を行っていると思います。その中にファイルシステムの使用量を監視するというものがあります。ファイルシステムのディスク使用量が100%になると様々な障害に発展する可能性があるからですが、実際に何が起こるでしょうか。
ログ出力用のファイルシステム
ファイルシステムの中で、日常的に使用量が増えるものとしては、ログの出力があります。ログ出力を行っているファイルシステムが100%になった場合、まず、新たなログが取得できなくなります。そのため、システムに問題が発生してもログから追跡することができない状態になりますので、問題への対処が難しくなってしまいます。
データベースが利用しているファイルシステム
日々データが増えるものとして、データベースがあります。データベースが利用しているファイルシステムのディスク使用量が100%になった場合は、データベースへの追記はもちろんできませんし、場合によっては、データベースが壊れてしまう可能性があります。この場合は、データベースのバックアップデータを復元することによる復旧頼みになります。
その他にファイルの作成ができなくなるケース
また、ファイルシステムの容量が多くなる事象と似たものに、iノードの枯渇というものがあります。小さいサイズのファイルを大量に作成するような場合、一見、ファイルシステムの容量はまだあるのにファイルの作成ができなくなるときがあります。その場合は、ファイルシステムの iノードを疑う必要があります。ファイルシステムは、ファイルのアクセス権などの情報を管理する iノードとデータで構成されています。iノードが枯渇すると、管理情報を用意できないためにファイルが作成できなくなってしまいます。この場合もサーバの運用に支障となる問題になることがあります。
従来、ファイルシステムを細かく分割しておく対策が主流でした。ファイルシステムの使用量による影響を小さくすることができるためです。
しかし近年、クラウドでは、単一パーティションで提供される場合も少なくありません。そのため、ファイルシステムを細かく分割することが、難しいケースが発生しています。また、運用の段階になってからパーティションを分割することはできないため、異なる方法での対策が必要になります。
こうした場合、運用監視によってなるべく早い段階でファイルシステムの使用量を減らすように対応していくことが望ましいといえます。ログローテーションの間隔を調整する、古いログは他のサーバへ移動させて削除する、データベースのメンテナンスをするなど、定期的に地道な対応が重要になります。
デージーネットでは、システム導入後サービスとして、こうしたチューニングのサポートを提供しています。ログのローテーションが適切に行われているかや、ファイルシステムフルが発生していないかなどを点検します。半年に一度点検を実施するため、定期的なチェックが可能となります。
安全に運用を継続していくために、定期的にファイルシステムの状態をチェックしてみてはいかがでしょうか。