Fess-サイト内検索など全文検索のオープンソース
今月の気になるオープンソース情報(2017年7月号)
OSS研究室 森 彰吾
皆さんは、こんなことを感じたことはないでしょうか?
- 社内であるファイルを探しても探してもみつからない
- WEBサイトを閲覧しても、欲しい情報が見つからない
今回はこのような課題を解決することができる、「Fess」というソフトウェアをご紹介します。
Fessは、いわゆる全文検索システムです。全文検索とは、文書データから特定の文字を検索することです。最もポピュラーな例としては、Google検索が挙げられます。Google検索は、世界中のWEBサイトの情報を収集し、ユーザの検索に応じて結果を返すようになっています。
Fessも基本的には同じような機能を持っています。
具体的には主に以下の機能があります。
これらの機能を利用することで、例えば自社内のファイルサーバを特定のキーワードで瞬時に検索できるようにしたり、WEBサイトにサイト内検索の機能を追加し、情報を発見しやすくすることができます。
Fessは全文検索システムとして優れている点が多くあります。
直感的なインタフェース
上記ような全文検索に必要な機能が、すべてWEBインタフェースで設定・利用できるということがあります。導入後、複雑なコマンドなどを必要とせず直感的なインタフェースで利用できるため、管理が容易です。
検索の高速さ
バックエンドにElasticsearchを利用しているため、RDBMSを利用した全文検索のシステムと比較して、非常に高速な検索を行うことができます。
ファイルの自動解析
データ収集時に様々なファイルの形式を理解して、解析を行うため、文書のタイトルだけの検索や本文で検索など、検索したい内容を絞ることもできます。解析可能なファイル形式は、MS Office(xls,xlsx,doc,docx,ppt,pttx)やPDF, html, xmlなどに対応しており、よく利用される形式がデフォルトで解析可能になっています。
LDAPとの連携
ファイルサーバの検索については、LDAPサーバと連携することで、ユーザやグループ毎にアクセスできるファイルを絞ることができます。つまりファイルサーバのアクセス権と同じような権限で、アクセス権があるファイルだけを検索できるということです。
このようにFessは、全文検索システムで「欲しい」と思う機能が詰まったソフトウェアです。
デージーネットでは、Fessを利用したファイルサーバ検索などのシステムを提案しています。またデージーネットコーポレートサイトに、サイト内検索の機能を追加することを検討しています。
ファイルやデータは増えれば増えるほど探すのが大変になっていきます。ファイルのパスを記録したメモファイルを作って、さらにファイルが増えていくという本末転倒なことも発生します。Fessを導入して、情報探しを楽にしてみてはいかがでしょうか。