PDFの目次(しおり/ブックマーク)を移行する方法

OCR処理を行ったり、ページサイズを変更することで、消えてしまうPDFの目次(しおり/ブックマーク)データをそのリンクもそのままに移行する方法をJPedalを使って簡単なコードで実現する方法を解説します。
PDFの目次(しおり/ブックマーク)を移行する方法

意外に難しいPDFの目次(しおり/ブックマーク)データの移行

紙のドキュメントをスキャナーで処理しPDFファイルにした、テキストがデジタルでは無いPDFのドキュメントには、よく目次(しおり/ブックマーク)が付けられていることがあります。最近ではテキストをOCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)を使って文字をデジタル化することも多くなってきました。

ところがPDFはOCR処理をしたり、PDFのページサイズを変更したりすると、新たにPDFファイルが書き出されるために、ほとんどの場合は目次がなくなってしまいます。

目次テキストは書き出せても、リンクが失われてしまう

Adobe社のAcrobatやPDFツールを使うことで、目次のテキストデータはPDFから書き出すことができ、新しいPDFへインポートすることはできます。ところが肝心な目次を押してリンク先へ飛ぶ機能は失われてしまうので、また、手作業で一つ一つリンクを設定しなければなりません。

1つや2つのファイルであれば手作業でも可能ですが、何百のファイルやページ数が数百ページあると手作業でやり直すのは非常に時間がかかり効率的ではありません。

JPedalを使えば簡単にPDFの目次(しおり/ブックマーク)を移行できます

JPedalは、開発者が簡単にJavaでPDFファイルを表示、変換、印刷、解析できるようにするJava SDKです。JPedalを使うことで、元のPDFの目次のデータを抽出し、新しいPDFへ目次を書き込むことが可能になります。目次はリンクも元のPDFと同様に新しいPDFへ移行しますので、数百ページのPDFの目次(しおり)の移行が簡単に行えます

Javaを使って目次(しおり/ブックマーク)をコピーするサンプルコード

まず、目次をDocumentオブジェクトに読み込みます:

				
					// 読み込み
final <a href="https://javadoc.idrsolutions.com/org/jpedal/examples/text/ExtractOutline.html" target="_blank" title="declaration: package: org.jpedal.examples.text, class: ExtractOutline">ExtractOutline</a> extract = new ExtractOutline("<a href="https://github.com/idrsolutions/idrviewer/tree/master/src/templates/complete/" target="_blank" title="The IDRViewer is a pure HTML/JavaScript/CSS viewer designed to display PDF and Office documents in the browser. It works alongside BuildVu which converts PDF documents to HTML5 or SVG pages. - idrviewer/src/templates/complete at master · idrsolutions/idrviewer" hreflang="en">source</a>.pdf");
extract.openPDFFile();
final <a href="https://javadoc.idrsolutions.com/org/jpedal/examples/text/ExtractOutline.html" target="_blank" title="declaration: package: org.jpedal.examples.text, class: ExtractOutline">Document</a> outlines = extract.getPDFTextOutline();
extract.closePDFfile();

				
			

そして、Documentオブジェクトを出力先PDFに書き込みます:

				
					// 書き込み
final OutlineWriter writer = new OutlineWriter("destination.pdf", outlines);
writer.writeOutline();
				
			
コマンドラインを使った目次(しおり/ブックマーク)の移行方法のサンプルコード

JPedalは、PDFファイル間でしおりをコピーする便利なコマンドラインメソッドも提供しています:

				
					// 読み込み
final ExtractOutline extract = new ExtractOutline("<a href="https://github.com/idrsolutions/idrviewer/tree/master/src/templates/clean/" target="_blank" title="The IDRViewer is a pure HTML/JavaScript/CSS viewer designed to display PDF and Office documents in the browser. It works alongside BuildVu which converts PDF documents to HTML5 or SVG pages. - idrviewer/src/templates/clean at master · idrsolutions/idrviewer" hreflang="en">source</a>.pdf");
extract.openPDFFile();
final Document outlines = extract.getPDFTextOutline();
extract.closePDFfile();

				
			

JPedalはPDFをシステムで扱う時に、非常に役立つJavaのSDKです。

JavaのPDFビューア、PDFファイルを画像に変換、PDFファイルの検索、PDFファイルの印刷、画像の抽出、テキストの抽出、メタデータの抽出、アノテーションの編集と追加などが数行のコマンドで実行できます。

無料のトライアルも提供していますので、ぜひ一度お試しください。

JavaでPDFを扱う開発には多機能・高性能な開発ライブラリー(SDK) JPedalがきっとお役に立つことと思います。JPedalは無料で試用していただけます。まずはご自身の環境で機能や品質をご確認のうえ、ぜひ導入をご検討ください。

取り扱い製品について

PDF規格は複雑なうえに、過去からの積み重ねで非常にわかりにくくなっています。PDF連携ソフトウェアの開発では、英国IDRsolutions 社のPDF関連製品(変換ツール、ライブラリ、ソフトウェア部品など)を、ぜひご検討ください。
IDRsolutions はPDF関連ツールを20年以上に渡って開発・提供し続けています。PDF分野の老舗企業として、世界中の企業や公的機関にご活用いただいています。
日本では株式会社インターワークがIDRsolutions社の日本総代理店として取り扱っていますので、お気軽にご相談ください。

VIEWING PRODUCTS
BuildVu

PDFをHTML5やSVGに変換

PDFのフォームをHTML5に変換

SDK PRODUCTS
JPEDAL

PDFファイルの表示、変換、抽出

多くの画像ファイル形式を読み書き、変換、操作、処理

JavaでPDFファイルを表示、変換、印刷、処理

PDFドキュメントを扱う必要のあるJava開発者のためのPDFライブラリです。このライブラリは、PDFファイルを扱う際の一般的な問題を解決します。

PDF からページを抽出する

JPedal は、PDF ファイルから簡単にページを抽出できるようにするいくつかの方法を提供します。これらのツールを使用すると、指定したページのコンテンツのみを含む PDF のコピーを作成できます。元のファイルは、出力で上書きしない限り、このプロセスによって変更されないまま残ります。この機能は、バージョン 2024.01 の時点でプレビュー段階にあります。プレビュー段階の API は完成されていないため、変更される可能性がありますが、これらはユーザーがリリース前にテストしてフ

PDFに目次(しおり)を追加する

PDFの目次(しおり)は、ユーザーが文書内を移動することができます。目次の追加はプログラムで行うことができます。目次のコピーは、プログラムまたはコマンドラインから行うことができます。PDFファイルに目次(しおり)を書き出す方法目次は Document オブジェクトで表されます。プログラムでPDFファイルから別のPDFファイルへ目次(しおり)をコピーする方法JPedalでは、PDFファイルから目次を取り出し、別のPDFファイ

PDFファイルへ目次(しおり)とリンクを追加する

PDFのアウトライン - 目次(しおり)は、ユーザーが文書内リンクとしてページを移動することを可能にします。これら目次の追加は、プログラムによって行うことができます。アウトラインのコピーと組み合わせることで、目次とリンクの移行が可能になります。PDFファイルへのアウトラインの書き込み方法アウトラインは、Document オブジェクトで表現されます。final Document outline;final OutlineWriter outl

Facebook
Twitter
Email
公式ブログロゴ

製品に関する記事や開発者のブログ

開発チームに最適なJava画像ライブラリとは?

画像処理は現代のJavaアプリケーションにおいて避けて通れない機能の一つです。Webサービスでのサムネイル生成、ドキュメント管理システムでのファイル変換、データ分析での可視化出力など、様々な場面で画像ライブラリの品質がシステム全体の安定性を左右します。

多くの開発チームが最初に手を伸ばすのは、Java標準のImageIOやオープンソースのライブラリでしょう。確かに導入は簡単で、基本的な画像処理には十分に見えます。しかし、プロダクション環境で実際に運用を始めると、思わぬ落とし穴に遭遇することがあります。

開発チームに最適なJava PDFライブラリとは?

「オープンソースで十分じゃない?」
そう考えるエンジニアは少なくありません。確かに無償のライブラリは機能が豊富で、改変も自由です。しかしバグ修正やセキュリティパッチを自分たちで追い続ける労力、サードパーティのパッケージを呼び出すリスク、そしてライセンス条件の判断に迷う時間などを考えると、コードを書かない”隠れコスト”が静かに膨らんでいきます。

「保守や脆弱性対応に追われて本来の開発が進まない!」

そんな声が聞こえてきたら、商用ライブラリへの切り替えどきかもしれません。

開発チームに最適なPDF-HTML変換ツールとは?

開発チームに最適なPDF-HTML変換ツールとは?PDFからHTMLへの変換において開発者が直面する課題と、それを解決するBuildVuの特長を解説。正確な変換品質、スケーラビリティ、セキュリティ、開発者フレンドリーな出力、そしてシンプルな料金体系で、チーム開発の効率を高める方法をご紹介します。

PDFファイルを扱うシステム開発・ウェブ開発に役立つ

開発者向けPDF入門ガイド

開発者向けPDF入門ガイド

PDFの基礎から応用まで開発者のための入門ガイド2024年版

PDF の仕様や活用方法など、開発者に必要な情報がコンパクトにまとめました。初めてPDFを扱う開発者にも分かりやすく、基礎から応用までカバーしているため、PDF のポテンシャルを最大限に引き出し、アプリケーション開発やドキュメント管理の効率化を図るための手引きとなるでしょう。技術的な側面に興味がある開発者だけでなく、ビジネスでPDFを有効活用したい方にもおすすめの一冊です。

MENU
PAGE TOP