Fessとは
Fessとは、オープンソースソフトウェアの全文検索システムである。CodeLibs Projectによって開発され、Apacheライセンスで提供されている。Fessはwebサイトやファイルサーバのデータを収集・解析することができる。つまり、Fessを利用することで、サイト内検索やファイルサーバの全文検索を行うことができる。Fessは全文検索エンジンのElasticsearchと連携しているためデータの検索も非常に高速である。
昨今では、様々な情報が電子データとなって保管されている。それはWEBサイトやファイルサーバでも同様である。これらの情報は、見つけるための仕組みがなければ、誰も利用できない無意味なものになってしまう。この問題を解決する一つの手段が、全文検索システムである。Fessを利用することで、比較的安価に素早く全文検索のシステムを構築することができる。
Fessの特徴
Fessの特徴は以下である。
- 様々なデータソースからのデータ収集
- 多くの形式に対応したデータの解析処理
- 高速なデータの検索
データ収集
Fessには、様々なデータを収集・解析する機能がある。Fessは以下の収集先からデータを集める。
- WEBサイト
- ファイルサーバ(Samba/FTP)
- データストア(CSV/RDBMS/Elasticsearch等)
解析可能なデータ形式
Fessは幅広い用途で利用することができる。それは、Fessが様々な形式のデータを解析して保存することができるためである。Fessが解析可能なデータ形式として、以下の形式がある。
- MS Office形式(docx,xlsx,pptx)
- OpenDocument形式(odt,odf,odp)
- XML
- HTML
- TEXT
- 圧縮ファイル(gz, tar, zip)
その他、Fessは各種ソースコードの形式やmp3や動画ファイルのメタデータなども解析可能である。
Fessを使った検索
Fessには収集したデータを検索するWEBインタフェースが付属している。このインターフェースから欲しい検索結果に簡単に素早く到達することができる。キーワードでの検索の他、AND/ORなど各種条件による検索を行うこともできる。
またFessはバックエンドにElasticsearchを利用している。Elasticsearchは、大容量のドキュメントの全文検索を想定したシステムで、非常に高速なデータ検索を行うことができる。このためFess自体の検索速度も非常に早い。
デージーネットの取り組み
デージーネットでは、コーポレートサイトのサイト内検索や、社内ファイルサーバの検索にFessを利用している。
また、デージーネットではFessを利用したファイルサーバの全文検索システムや、サイト内検索システムの構築サービスを行っている。
【カテゴリ】:システム管理  ビッグデータ  オープンソースソフトウェア  
【Webセミナー】自社でOSSを採用しよう!今更聞けないOSSの基本セミナー
日程: | 11月22日(金)Webセミナー「BigBlueButton」を使用します。 |
内容: | OSSを導入したいけど、どこから手をつければいいかわからない方必見! |
ご興味のあるかたはぜひご参加ください。 |