大量の PDF ドキュメントを Fess と BuildVu を使って、高速ドキュメント検索システムを構築する
Quiitaの記事として、BuildVuを使った高速ドキュメントデータベースの構築例をまとめました。
是非、ご覧下さい。
大量の PDF ドキュメントを Fess と BuildVu を使って、高速ドキュメント検索システムを構築する
https://qiita.com/iwanami-intwk/items/d64d392ed28cd8a05de6
PDF を HTML に正確に変換できる BuildVu と、オープンソースの全文検索サーバー Fess を組み合わせることで、大量の PDF からドキュメントデータベースを構築し、高速ドキュメント検索システムを短時間で構築する事が可能です。
本稿では BuildVu で PDF から HTML へ変換されたドキュメントを Fess で検索できるようにするための Fess の設定例をご紹介します。
なお、利用している Fess のバージョンは 13.2.1 です。
このページでは、BuildVuについてより詳しく学び、お使いのマシンでの実行を開始するお手伝いをします。 サポートについて ご質問がある場合、BuildVuの使用に関してサポートが必要な場合、またはバグレポートを送信したい場合は、サポートリクエストフォーム にご記入ください。サポートスタッフのメンバーができるだけ早くご連絡いたします。 サポートシステムの詳細については、サポートシステムはどのように動作しますか? をご覧ください。 BuildVuの実行 BuildVuをローカルで実行する場合は、Javaがインストールされていることを確認する必要があります。サポートされているJavaバージョンについては、BuildVuはどのJavaバージョンをサポートしていますか? をお読みください。 以下のガイドを用意しています: コマンドラインからのBuildVu実行 JavaからのBuildVu実行 他の言語からのBuildVu実行 アプリケーションサーバーへのBuildVuデプロイ また、BuildVuを最大限に活用するためのさまざまなチュートリアルや、より技術的な詳細を提供するAPIドキュメントもご用意しています。 関連するセクションには、よくある質問やヒントも含まれています。 Javadocへのアクセス BuildVuのJavadocはオンラインでアクセス できます。 BuildVuリリース BuildVuの新バージョンは6週間ごとにリリースされ、お客様には日次プレリリースjarも提供しています。違いの詳細については、リリース版と日次版のjarの違いは何ですか? をお読みください。

