メールマガジン

~GlusterFS~スケーラブルな分散ファイルシステム

今月の気になるオープンソース情報(2016年3月号)

OSS研究室 森 将史

大量のデータを保存し、複数人で使う仕組みとして、分散ファイルシステムが開発されてきました。分散ファイルシステムの特徴として、

  • 複数のサーバに分散してファイルを配置することで大量のデータを扱えること。
  • ユーザにはそれがあたかも1つの場所にあるかのように見せることで、実際のデータの格納方法を意識せず使えること。
などが挙げられます。

今回紹介するGlusterFSは、分散ファイルシステムの一つです。導入や利用の簡単さと、拡張性の高さが特徴と言われています。最初は小さな規模で導入し、必要になればその都度拡張していくことができます。

拡張性の高さは、GlusterFS内部のファイル格納の仕組みによってもたらされています。GlusterFSは、ボリュームという単位でディスク容量を管理します。ボリュームはさらに、内部的にブリックという単位に分割されています。ブリックは実際にはサーバ上のディレクトリで、保存されるファイルはブリックに分散されて配置されます。その分散には複数の方法があり、可用性や動作速度、あるいは容量などの使用目的にあわせて選択することができます。

ファイルの分散・保存方法には3つの基本タイプがあり、「分散(Distributed)」「複製(Replicated)」「ストライプ(Stripe)」と呼ばれます。それぞれ、拡張できる、信頼性が高い、データを読むのが早い等の特徴があります。これらの2つを組み合わせて使用することもでき、拡張ができるし信頼性も高い、という構成も可能となっています。

また、運用中にシステムを停止することなくストレージのサイズを拡張することも可能ですので、止められないシステムを構築する時にはとても便利に利用できます。

デージーネットでは、GlusterFSのインストール方法からファイルシステムとしてのベンチマークなどを行い、実際に構築し運用していくための調査を実施しています。扱うデータのサイズが大きく増加する可能性がある、データへのアクセス量が多い、データを失うと困る、というようなシステムを構築する場合には、GlusterFSの利用を検討してはいかがでしょうか?

デージーネットマガジン2016年3月号記事一覧

~GlusterFS~スケーラブルな分散ファイルシステムの先頭へ