-
サーバ構築のデージーネットTOP
-
OSS情報
-
一押しOSS
-
Fess〜全文検索システムのOSS〜
-
ファイルサーバ全文検索
ファイルサーバ全文検索
「Fess」によるファイルサーバ全文検索を利用することで、煩雑になりがちなファイル検索を便利に、使いやすくすることができます。ここでは、ファイルサーバの全文検索を実装すると何ができるようになるのか、どんな点で「Fess」を利用したファイルサーバの全文検索が優れているのかを紹介します。
Fessのファイルサーバ全文検索
ファイルサーバ内にある大量の文書ファイルから見たいファイルを探すのに時間がかかることは多くの企業で起こっている問題です。OSSの全文検索システム「Fess」を利用しファイルサーバの全文検索システムを構築することでこの問題を解消できます。
Fessの資料をダウンロードする
ファイルサーバ内のデータを瞬時に検索
Fessを利用してファイルサーバの全文検索システムを実装すると、欲しいファイルを瞬時に検索することができます。これは、Fessが標準でビッグデータに対応した全文検索エンジンであるOpenSearchと連携しているためです。
OpenSearchと連携したファイルサーバ全文検索
OpenSearchとは、ビッグデータの解析に使われる全文検索エンジンです。OpenSearch projectによって、Apache License 2.0のライセンスで公開されています。OpenSearchを利用すると、大容量のデータから必要なデータを素早くに取り出すことができます。OpenSearchには、主に以下の特長があります。
- 検索性能
全文検索に特化しており、検索速度を向上させるように設計されています。事前に全文検索の対象となるデータを検索し易い形式で保存するため、高速な全文検索が実現できます。
- 検索エンジン
OpenSearchでは、大量のデータから指定したキーワードに一致するデータを抽出することができます。この機能は、ファイルサーバ全文検索に利用されます。また、大量のデータから、指定したキーワードに一致するデータを抽出することができます。そのため、ファイルサーバ全文検索だけでなく、大量のログデータから特定のキーワードを含むログだけを検索するような時にも利用できます。
- スケーラビリティ
大規模データに対応するために検索処理やデータ配置を分散することができます。また、システムを拡張する時は、システムを停止することなくサーバを追加できます。導入時はスモールスタートで始め、利用者が増えてきたらサーバを追加するというようにシステム拡張を容易に行うことができます。サーバを追加した時、データは自動的に各サーバに分散して再配置されます。
このように、FessはOpenSearchと連携することによってファイルサーバ全文検索の結果を瞬時に表示することを実現しています。また、ファイルサーバの規模に応じてサーバの台数を増やすなどしてスケールアウトすることもできます。
「OpenSearch〜Elasticsearchをベースとした全文検索エンジン〜」へ
ファイルサーバ内の欲しいファイルに最短でアクセス
Fessを利用したファイルサーバ全文検索では、欲しいファイルに最短で到達することができます。それはFessが、ファイルサーバをクロールする際、ファイルデータに特定の「ラベル」を付けることができるためです。この機能を利用して、ファイルサーバのデータをコンテンツごとにラベルでカテゴライズすることで、「絞り込み検索」や「ソート検索」が可能になります。
例えば、ファイルサーバからデータを取得する際、企画の提案書や見積書などに個別のラベルをつけておきます。そうすることで、ファイルサーバ全文検索の際に絞り込み検索を利用することができ、目的のファイルに到達する時間を短縮することができます。
ActiveDirectoryと連携し、各ユーザが閲覧できるファイルのみを表示
Fessでのファイルサーバ全文検索の際に、ユーザの権限で閲覧できるファイルのみを検索結果として表示することができます。これは、FessがLDAPやActiveDirectoryなどの認証サーバと連携する機能を利用したものです。その機能を利用することで、ファイルサーバ内でのアクセス権がFessでのファイル検索にも適用されます。本来見ることができないファイルが検索結果に表示されることを防ぎ、企業内でもファイルサーバ全文検索を安心してお使いいただけます。
多種多様なファイル形式に対応
Fessでは企業のファイルサーバに保存された多くのファイルを検索できます。Fessのファイルサーバ全文検索が多くのファイル形式に対応しているためです。Fessのファイルサーバ全文検索が対応しているファイル形式は以下です。
- MSOfficeファイル(xls,xlsx,doc,docx,ppt.pptx)
- OpenDocumentファイル(odt,ods,odp)
- テキストファイル
- PDFファイル
- XML,HTMLファイル
- 圧縮ファイル(zip,tar,gz)
- mp3などのメタ情報
- etc...
大規模なファイルサーバにも対応
Fessでのファイルサーバ全文検索は大規模なファイルサーバにも対応することができます。方法としては、次のようなものがあります。
- 複数のクローラを同時に動作させる
- OpenSearchをクラスタ構成にする
なお、デージーネットでは、ファイルサーバの性能やディスク容量を圧迫しないように、外部に検索サーバを構築することを推奨しています。
Fess導入の検討資料を無料でダウンロードいただけます。
Fessを利用したサイト内検索とファイルサーバ全文検索についてまとめた資料です。Fessは、ビッグデータの解析に使われる検索エンジンと連携するため、非常に高速に動作します。Fessについて情報を収集する際、サービスをご検討いただく際などにお役立てください。
デモのお申込み
もっと使い方が知りたい方へ
Fessの操作方法や操作性をデモにてご確認いただけます。使い方のイメージを把握したい、使えるか判断したい場合にご活用下さい。Fessのデモをご希望の方は、下記よりお申込みいただけます。
全文検索システムFess
- ファイルサーバ全文検索
- Fessの機能を利用して、ファイルサーバの全文検索を行うことができます。ここでは、ファイルサーバ全文検索の便利なところを紹介します。
- Fessのよくある質問
- ここでは、全文検索システムFessの導入検討時にお客様からいただくよくある質問を紹介します。
全文検索システム Fess「構築事例/情報の一覧」
Fessは全文検索サーバです。WEBサイト内やファイルシステム内のデータを自動的に収集してElasticsearchに保管し、全文検索を行うことができます。データの収集の設定や検索のためのWEBインタフェースが用意されているため、導入してすぐ全文検索システムを使うことができます。
ファイルサーバの検索性能向上を検討されていたお客様に、高速に全文検索を行うことができるOSSの全文検索システム「Fess」を導入した事例についての記事です。また、ファイルサーバの権限から検索対象の制限を設定したいという使い方のご希望に合わせ、システムを構築しました。
ホームページにサイト内検索の機能を持たせたいということで、相談を受けました。デージーネットからは、OSSであるFessを使った全文検索システムを提案しました。サイト内検索の統計情報や、検索キーワードなどはKibanaを使って参照できるようになり、SEO対策にも生かせるようになりました。
社員の情報共有のために、ファイルサーバに保管されている情報を効率よく検索するシステムを導入したいという要望があり、OSSのFessを提案しました。ビッグデータの技術を利用して高速検索ができるようになり、ファイルを探す手間が省けるようになりました。
お客様は、全文検索システムとしてFessを利用していました。最新版にアップデートを希望されていましたが、最新版のFessは、利用しているOSへの対応を終了していました。稼働中のシステムへの影響を最小限に抑えてアップデートをご要望していたため Dockerコンテナを活用し、Fessのアップデートを行いました。
CATVのインターネットサービスでは、障害の対応や犯罪捜査への協力のために、IPアドレスから利用者を特定しなければならない場合があります。従来は、DHCPサーバ、WWWサーバ、メールサーバ、課金システムなどの膨大なログをgrepコマンドを使って調査し、利用者を特定していました。そのため、調査は大変時間がかかる作業でした。この調査を効率化できないかと相談を受け対応しました。
OpenSearchとは、Elasticsearchをベースに開発された全文検索エンジンです。このページでは、OpenSearchの開発経緯、OpenSearchの特徴、Elasticsearchとの互換性について紹介します。
Elasticsearchは、Apache Luceneをベースに開発された全文検索エンジンです。このページでは、Elasticsearchの特徴、Elasticsearchと周辺ツール、Elasticsearchに対するデージーネットの取り組みを紹介します。
Graylogとは、GUIからログサーバの管理やログの参照、検査、可視化などを行うことができる統合ログ管理ソフトウェアです。Graylogは、Graylog,INCによって開発・管理されているOSSで、GPLv3ライセンスの元で公開されています。
働き方改革を促進するために、テレワーク環境の整備や生産性の向上などが求められています。ここではテレワークで使えるおすすめOSSについて紹介します。