大量の PDF ドキュメントを Fess と BuildVu を使って、高速ドキュメント検索システムを構築する
Quiitaの記事として、BuildVuを使った高速ドキュメントデータベースの構築例をまとめました。
是非、ご覧下さい。
大量の PDF ドキュメントを Fess と BuildVu を使って、高速ドキュメント検索システムを構築する
https://qiita.com/iwanami-intwk/items/d64d392ed28cd8a05de6
PDF を HTML に正確に変換できる BuildVu と、オープンソースの全文検索サーバー Fess を組み合わせることで、大量の PDF からドキュメントデータベースを構築し、高速ドキュメント検索システムを短時間で構築する事が可能です。
本稿では BuildVu で PDF から HTML へ変換されたドキュメントを Fess で検索できるようにするための Fess の設定例をご紹介します。
なお、利用している Fess のバージョンは 13.2.1 です。
JDELI – 幅広い画像フォーマットを読み書きするJava SDK
Javaでイメージファイルを安全に扱うJDeliは、HEICやその他のイメージファイル形式をJavaで簡単に読み書き、変換、操作、処理できるようにするJava SDKです。HEIC画像の読み出し/書き込みJDeliは、開発者にHEIC画像フォーマットの包括的なサポートを提供します。また、JPEG/JPEG2000、PNG、TIFFファイルを含む他の画像フォーマットのサポートも強化されています重要なファイルを安全に保管

