PDFに最適な圧縮形式は?

Portable Document Format(PDF)には、ファイルサイズと品質の最適なバランスを実現するための複数の圧縮オプションが用意されています。圧縮の選択は、PDF内のコンテンツの種類や希望する出力品質など、さまざまな要因によって異なります。この記事では、こうした要素についてご紹介します。
開発者ブログ

著者 Promil (IDRsolutions)  翻訳 インターワーク

非可逆圧縮と可逆圧縮の違いは何ですか?

ロスレス圧縮: 元のデータを完全に保持する。非圧縮の場合、データは元の形式と同じままです。

次のような用途に適しています: テキスト、PDF内のファイルオフセット位置、ベクターグラフィックス、その他精度を必要とするコンテンツ。

非可逆圧縮: ファイルサイズを小さくするために一部のデータが破棄されます。品質が低下する可能性がありますが、特定のシナリオでは気付かれないことがよくあります。

次のような場合に適しています: 若干の品質低下が許容されるカラー画像。

PDFを圧縮するには、どのオプションが最適ですか?

理想的な圧縮方法は、文書の内容と目的によって異なります。一般的に、ファイルサイズと画質はトレードオフの関係にあります。PDFの圧縮アルゴリズムは、あなたにとってどれが最も重要かによって、異なる最良の選択肢を表します。詳しくは下記の「画像とテキストに最適な圧縮方式は?」をお読みください。

PDF文書にはどのような種類のコンテンツがありますか?

PDFは汎用性があり、さまざまな種類のコンテンツをカプセル化することができます。

  1. テキストとベクターグラフィックス: これらは主にバイナリストリームで保存されます。その正確な性質のため、元の品質と精度を保つためには可逆圧縮が必要です。
  2. 画像:PDF内の画像は、個別のXObjectとして保持されます。画質とファイ ルサイズに対する 必要性に応じて、画像のピクセルデータは、可逆形式か非可逆形式のどちらかによって圧縮することができます。これは以下のような追加属性を持ちます:
    カラースペース: 画像のカラースペクトルを定義する。正確を期すため、常に可逆圧縮されます。
    マスク:これは画像の透明度を決定するもので、正しく表現するためには可逆圧縮で保存する必要があります。
  3. 固有のPDFオブジェクト: これらはPDF文書を構成する基礎となるオブジェクトです。これらのオブジェクトは、文書のデータの完全性と正確性を保証するために、つねに可逆アルゴリズムを用いて圧縮する必要があります。

画像とテキストに最適な圧縮方式は?

CCITT:白黒画像に最適で、非常に効率的に圧縮できるように設計されています。CCITTにはさまざまなグループがあり、PDFではグループ4が最も一般的です。モノクロ画像を効率的に圧縮します。CCITT圧縮とは何かについてのブログをお読みください。

Flate:テキストと混合コンテンツの文書に使用されます。テキストや画像データに適した、汎用性の高い可逆圧縮です。PDFのコンテンツを圧縮する主要な方法の1つです。

JBIG2:2値(白黒)画像に使用されます。CCITTグループ4よりも圧縮率が高く、特にテキストページのスキャンに適しています。可逆圧縮と非可逆圧縮があります。

LZW:拡張画像や中程度の詳細画像に使用されます。LZWは可逆圧縮方式で、歴史的にGIFやTIFFに使われてきました。詳しくはLZW圧縮のブログをご覧ください。

RLE: 単色画像のように、大きなバイト列が繰り返されるデータに使われる。単純な可逆圧縮の一種で、データの連続が1つのデータ値とカウントとして保存されます。

ZIP:テキストと画像の汎用圧縮です。PDF圧縮におけるZIPは、基本的にFlate方式です。可逆圧縮であり、適切な圧縮率を提供します。

JPEG(DCT):フルカラー写真に用いられる。画像データを空間周波数に変換する非可逆圧縮方式。人間の目には目立ちにくい周波数を破棄し、ファイルサイズの大幅な削減につながる。しかし、アーチファクトが発生する可能性があります。

JPEG2000 (JPX): 高品質の画像や写真に使用されます。可逆圧縮と非可逆圧縮の両方が可能。従来のJPEGよりも圧縮率が高く、アーチファクトが少ない。

アーチファクトとは?

画像のartifacts(アーチファクト)は、画像がオリジナルの内容から変わってしまう不具合やノイズを指します。これらは、画像の圧縮、伝送、デジタル化、または画像処理の過程で生じることがあります。例えば、JPEG圧縮においては、圧縮率が高いとブロックノイズやリング状のノイズが生じることがあります。

1つのPDFで複数の圧縮方法を使用できますか?

PDFでは、要素ごとに異なる圧縮を使用することができます。たとえば、同じ文書内で、テキストとベクターグラフィックには可逆圧縮を使用し、画像には非可逆圧縮を使用することができます。

PDFを暗号化すると圧縮に影響しますか?

暗号化と圧縮は別のプロセスです。PDFが暗号化されると、暗号化されたデータはうまく圧縮されないため、追加の圧縮は効果的でないかもしれません。まず圧縮してから暗号化することをお勧めします。

圧縮の違いによるレンダリング速度への影響はありますか?

はい、より積極的な圧縮はファイルサイズを小さくするかもしれませんが、コンテンツの解凍とレンダリングにかかる時間も長くなります。しかし、ファイルサイズが小さいほどダウンロードは速くなります。

PDFアプリ開発ツール(SDK)をお探しのみなさま、効率のよい開発作業のためにJPedal、BuildVu、JDeliがきっとお役に立つことと思います。
これら3製品は無料で試用していただけますので、まずはお試しのうえ、ぜひ導入をご検討ください。
JPedal、BuildVu、JDeliのシステム開発やプログラミング、無料トライアルの情報は下記の各製品のトライアルページをご覧ください。技術的なことから費用面まで、ご質問・ご相談も各製品ページの問合せボタンからお寄せください。

BuildVuは高機能で実績豊富なPDFソフトウェア開発ツール

PDFソフトウェアの開発ツールをお探しなら、ぜひBuildVuをご検討ください。BuildVuでのPDFソフトウェア開発・提案をサポートしています。BuildVuを利用したシステムやソリューションの開発や提案、企画に役立つ情報を以下にまとめています。不明点やご質問がありましたら、ページ下部のご相談ボタンからお気軽にお問い合わせ下さい。

変換されたドキュメントの構造

変換されたファイル(一部)以下は、変換されたドキュメントの内訳で、生成されるHTMLとJSONのアセットを示しています。実際のドキュメントはこちら1.htmlconfig.jsannotation.jsonsearch.jason

HTML5やSVG専用のPDF変換ソフトを選びましょう

~ PDF編集ソフトのHTML変換は、低性能なオマケ機能かも!?「PDFをHTMLに変換すればいい」と単純に考えるのは危険です。PDFをHTMLに変換するには、例えばAdobe Acrobat DCを使って「書き出し形式 HTML Webページ」のような方法がありますが、これでは不十分です。PDF変換ソフト(PDF編集ソフト)に求められる性能のひとつが、PDFからHTMLへ変換した際の“見た目”の再現性です。Acrobatでは元のPDFドキュメントを正確に再現して書き出すこと

右綴じの書類がうまく表示されません

右綴じの書類は、PDF上で綴じ方の設定がされていなければなりません。綴じ方の設定はPDFのプロパティを変更することで設定できます。読み上げオプションの綴じ方を右に設定して下さい。 

Facebook
Twitter
Email
公式ブログロゴ

製品に関する記事や開発者のブログ

開発チームに最適なJava画像ライブラリとは?

画像処理は現代のJavaアプリケーションにおいて避けて通れない機能の一つです。Webサービスでのサムネイル生成、ドキュメント管理システムでのファイル変換、データ分析での可視化出力など、様々な場面で画像ライブラリの品質がシステム全体の安定性を左右します。

多くの開発チームが最初に手を伸ばすのは、Java標準のImageIOやオープンソースのライブラリでしょう。確かに導入は簡単で、基本的な画像処理には十分に見えます。しかし、プロダクション環境で実際に運用を始めると、思わぬ落とし穴に遭遇することがあります。

開発チームに最適なJava PDFライブラリとは?

「オープンソースで十分じゃない?」
そう考えるエンジニアは少なくありません。確かに無償のライブラリは機能が豊富で、改変も自由です。しかしバグ修正やセキュリティパッチを自分たちで追い続ける労力、サードパーティのパッケージを呼び出すリスク、そしてライセンス条件の判断に迷う時間などを考えると、コードを書かない”隠れコスト”が静かに膨らんでいきます。

「保守や脆弱性対応に追われて本来の開発が進まない!」

そんな声が聞こえてきたら、商用ライブラリへの切り替えどきかもしれません。

開発チームに最適なPDF-HTML変換ツールとは?

開発チームに最適なPDF-HTML変換ツールとは?PDFからHTMLへの変換において開発者が直面する課題と、それを解決するBuildVuの特長を解説。正確な変換品質、スケーラビリティ、セキュリティ、開発者フレンドリーな出力、そしてシンプルな料金体系で、チーム開発の効率を高める方法をご紹介します。

PDFファイルを扱うシステム開発・ウェブ開発に役立つ

開発者向けPDF入門ガイド

開発者向けPDF入門ガイド

PDFの基礎から応用まで開発者のための入門ガイド2024年版

PDF の仕様や活用方法など、開発者に必要な情報がコンパクトにまとめました。初めてPDFを扱う開発者にも分かりやすく、基礎から応用までカバーしているため、PDF のポテンシャルを最大限に引き出し、アプリケーション開発やドキュメント管理の効率化を図るための手引きとなるでしょう。技術的な側面に興味がある開発者だけでなく、ビジネスでPDFを有効活用したい方にもおすすめの一冊です。

MENU
PAGE TOP