-
サーバ構築のデージーネットTOP
-
OSS情報
-
一押しOSS
-
Fess〜全文検索システムのOSS〜
Fess〜全文検索システムのOSS〜
Fessは、オープンソースソフトウェアの全文検索システムです。全文検索とは、文書の本文全体を含むすべての文字情報を対象とした検索方法のことで、Webサイト内の検索やファイルサーバの検索に利用されています。この記事では、Fessの特徴や活用方法を解説します。
- +
目次
全文検索システムとは
全文検索とは、ファイルの中身の本文全体を含む全ての文字情報を対象とした検索技術のことです。全文検索では、ファイル名やフォルダ名に加え、その中身の全ての文字情報まで検索することが可能です。そのため、検索方法としては最も満遍なく検索できる手法と言われています。
全文検索を利用することで、探したい情報を見つけるまでの時間を大幅に短縮することができ、業務の効率化に大きく貢献します。また、日々蓄積・更新される社内のファイルデータから、社員が持つ知識やノウハウを瞬時に検索することができ、ナレッジ共有にも良い効果をもたらします。
一方で、検索対象となる範囲が広いため、検索に時間がかかるという欠点もあります。Fessはこの欠点を解決することができる全文検索システムです。
「全文検索とは」へ
Fessとは
Fessは、Javaで開発されたオープンソースの全文検索システムです。CodeLibsというプロジェクトで開発されています。Fessは、いわゆるコミュニティ版のソフトウェアで、商用サポート付きのバージョンとしてN2SM searchを利用することもできます。Fessには以下のような機能があります。
- WEBのデータ収集とデータの全文検索
- ファイルサーバの文書データ収集とデータの全文検索
- データストア(csv、RDBMS、OpenSearch等)からのデータ収集と全文検索
Fessは、LinuxではRPM形式とDEB形式のパッケージで配布されており、公式のDockerイメージ(codelibs/fess)も公開されています。また、ZIP形式のファイルをダウンロードしWindowsにインストールすることもできます。
Fessの資料をダウンロードする
Fessでできる全文検索
全文検索システムFessの機能を利用することで次のことができるようになります。
ファイルサーバの文書の全文検索
Fessでは、ファイルサーバに保管された大量の文書ファイルの中から、求めている文書を全文検索によって抽出することができます。
Fessは、対象フォルダに定期的にアクセスし、ファイルの内容を取得してインデックスを生成することができます。そのため、ファイルの全文検索を高速に行うことができます。Fessは、PDF、ExcelやWordなどのMS Officeの文書に対応しています。また、画像や動画のメタデータなども検索の対象にすることができます。さらに、ログインしたユーザによって、検索結果に表示されるファイルを制限できるというメリットもあります。ActiveDirectoryやLDAPとユーザー(パスワード)の情報を連携することも可能です。
「Fessでファイルサーバ全文検索」へ
「ファイルサーバ検索システム事例」へ
コーポレートサイトのサイト内の全文検索
コーポレートサイト内に検索窓を設置し、キーワードを入力することで、サイト内の全文検索を行うことができます。
Fessに検索対象のベースURLを登録しておくと、定期的に該当URLにアクセスし、リンクを辿ってサイト内をクロールします。そして、クロールして取得した情報を、辞書の索引のようにインデックス化することができます。この仕組みにより、サイト内検索を高速に行うことができます。検索結果の出力には、Fessの標準の検索画面を使うことができます。この場合には、デザインを編集することもできます。また、開発者用にAPIも公開されていますので、独自の検索プログラムを作ることもできます。
「Fessでサイト内の全文検索」へ
「Fessによるサイト内検索システム事例」へ
全文検索システムFessの特徴
OSSの全文検索システムFessには様々な特徴があります。ここではその特徴を紹介します。
ライセンスコストフリー
FessはOSSの全文検索システムです。構成するコンポーネントもすべてOSSのため、ライセンスコストフリーで実用的な全文検索システムを構築することができます。月額の利用量や、ユーザ数等による従量制の課金もありません。
日本語に対応した全文検索
全文検索システムFessは日本語に対応しています。そのため、基本的な内容はドキュメントを読むだけで理解することができます。これは、N2SMという日本企業が母体となりFessの開発を行っているためです。
設定・管理をWebインターフェースから
Fessは、直感的な操作で設定を行うことができ、インストール後すぐに使い始めることができます。なぜなら、Fessでは、検索対象、クローラの実行時間の設定、全文検索の条件など、全文検索システムの設定をWebインターフェースから簡単に行うことができるためです。下の画像は全文検索システムのクローラの設定画面です。
自動クロール
全文検索システムFessは、あらかじめクローリング開始時間を設定しておくことでその時間になると自動的にクロールし情報を収集します。
ファイルクロールの設定画面
大量のデータでも高速な全文検索を実現
全文検索システムFessは、膨大なデータから欲しい情報を瞬時に検索することができます。これは、Fessが標準でOSSの検索エンジンであるOpenSearchをデータベースとして採用しているからです。OpenSearchは、収集したデータをインデックス化して管理することで、高速な全文検索を実現しています。
OpenSearchと連携した全文検索
OpenSearchとは、ビッグデータの解析などに使われるオープンソースの全文検索エンジンです。OpenSearchは全文検索に特化し、事前に全文検索の対象となるデータを検索しやすい形式で保存するなど、検索速度の向上を目的として設計されています。そのため、高速な全文検索を実現しています。また、大規模データに対応するため、全文検索の処理やデータ配置を分散することもできます。システムの拡張も容易に行うことができ、サーバを追加した際はデータが自動的に各サーバに分散して再配置されます。
こうした点から、FessはOpenSearchと連携することによって全文検索の結果を瞬時に表示することを実現しています。また、規模に応じてサーバの台数を増やすなどして、全文検索システムのスケールアウトも可能です。
多種多様なファイル形式に対応した全文検索
全文検索システムFessは、多くのファイル形式に対応しています。全文検索に対応しているファイル形式は以下です。
- MSOffice形式(xls,xlsx,doc,docx,ppt.pptx)
- OpenDocument形式(odt,ods,odp)
- テキスト
- PDF
|
- XML,HTML
- 圧縮ファイル(zip,tar,gz)
- mp3などのメタ情報
- etc...
|
デスクトップ検索
FessのWeb画面で検索すると、検索結果にはfile://path/といったリンクが表示されます。しかし、最近のブラウザでは、セキュリティ上の問題があるとして、このようなリンクが機能しなくなっています。
そのため、Fessではデスクトップ検索機能をサポートしています。デスクトップ検索機能を有効にしておくと、リンクをクリックするとFessがファイルを読み込んで、Web経由でファイルを表示することができます。
多くの検索方法を搭載
データの検索では、いかに早く欲しい情報へ到達するかも重要なポイントです。Fessには、AND検索やOR検索など、様々な検索方法が用意されています。これらの検索方法を工夫して単語を検索すれば、目的としているページやファイルへの到達性が向上します。対応している検索方法は次の通りです。
全文検索システムFessの応用
全文検索システムFessは他のOSSと連携することでさらに便利に使うことができます。
ユーザ動向をチェック
Webサイトの管理者にとって、ユーザの動向やニーズはサイト改善などにおける重要な情報です。Fessでは、全文検索をした際の検索ワードや接続元のIPアドレス、検索から結果を表示するまでの時間など、さまざまな情報が履歴として残るため、これらの情報を元にユーザの動向を解析することができます。さらに、こうした全文検索を行った際の情報を、KibanaなどのOSSの可視化ソフトウェアで分かりやすく参照することも可能です。
画像文書の検索
FessのOCR機能を利用すると、PNGやPDF(画像)に含まれる文章画像を検索ができるようになります。調査の結果、1/4倍まで縮小コピーされた文書でも充分に読み取ることができます。OCR機能を付加した全文検索システムを導入することで、スキャナで取り込んだ紙の文書も検索できるようになり、ペーパーレス化を推進しつつ業務効率も向上することが可能になります。
「OCR機能で文書画像の全文検索」へ
注意点
Fessは、簡単に全文検索のシステムとして利用することができます。しかし、検索対象のファイル数や容量が多くなると、チューニングが必要になります。チューニングをするためにはOpenSearchに関する詳細な知識が必要であるため、専門的な知識を持っていない人には難しいという課題があります。また、ファイル数が増えるとクローリングにも時間がかかることから、システム構成やクローリング設定にも工夫が必要です。
デージーネットでは、全文検索システムFessの導入をサポートします。システム構成やクローリング設定のほか、オンプレ型やクラウド型環境への対応など、お客様の要件やお悩みをヒアリングしたうえで、ご要望に応えた全文検索の環境を構築します。無料見積も実施しておりますので、費用など詳しい情報はお気軽にお問い合わせください。
無料見積を依頼する
デージーネットのサービス
デージーネットでシステムを構築していただいた場合は、導入後の保守サポート(Open Smart Assistance)をご利用いただくことも可能です。このサービスでは、使い方から運用方法まで幅広い範囲でのQ&Aや、セキュリティ情報の提供、障害調査など、導入後も安心して利用して頂けるよう管理者の運用業務をサポートします。
「Fessの保守・サポート」へ
なお、デージーネットでは、Fessのインストール方法や使い方、詳しい機能などを調査し、調査報告書に掲載しています。調査報告書は無料でダウンロードすることが可能です。
検討資料を無料でダウンロードいただけます。
サイト内検索とファイルサーバ全文検索についてまとめた資料を提供しています。サービスをご検討いただく際などにお役立てください。
デモのお申込み
もっと使い方が知りたい方へ
操作方法や操作性をデモにてご確認いただけます。使い方のイメージを把握したい、使えるか判断したい場合にご活用下さい。デモをご希望の方は、下記よりお申込みいただけます。
全文検索システムFess
- ファイルサーバ全文検索
- Fessの機能を利用して、ファイルサーバの全文検索を行うことができます。ここでは、ファイルサーバ全文検索の便利なところを紹介します。
- Fessのよくある質問
- ここでは、全文検索システムFessの導入検討時にお客様からいただくよくある質問を紹介します。
「構築事例/情報の一覧」