fbpx

PDF軽量化はHTML変換が効果的・・・閲覧者・制作者の両方が喜びます

PDFの圧縮では、画像の解像度を下げるなどの基本的な対処をしますが、その後は簡単にできる対策はありません。そうなったらPDFのままファイルサイズを減らそうとせず、HTMLに変換するのが効果的です。ウェブで見ることが多い文書なら、この方が閲覧者からも喜ばれます。
PDF軽量化はHTML変換が効果的。閲覧者・制作者の両方が喜びます

PDF1/60に軽量化できHTML。PDFからHTMLに変換すれば簡単 

結論から先にお知らせします―――ネットに載せるPDFの軽量化なら、PDF→HTML変換ツールを使って、HTMLに変換してサイトに載せるのがいちばん効果的です。 

企業や役所がウェブで公開することが多く、一般の方が閲覧する機会が多い3パターンの文書について、PDFと、PDF→HTML変換したもので比較しました。その結果、PDFに比べてHTMLなら最大で1/60(PDFの1.7%)にデータ量を削減することができました(下表)。 

比較テストはPDFファイルと、PDF→HTML変換ツールBuildVu(ビルドビュー)で変換したHTMLで行ないました。具体的には、BuildVuにPDFファイルを入力すると、変換しHTMLファイル(HTML、CSS、JavaScript、JSONなど)を出力します。これらPDFとHTMLのそれぞれで閲覧時データ量を集計しました。 

BuildVuの変換手順

BuildVuは図面がズレない、複雑な雑誌のレイアウトも再現、縦書きやふりがな(ルビ)付きの日本語にも対応する高機能なPDF→HTML変換ツールです。BuildVuは、PDFのページごとにHTMLファイルを生成します。つまり閲覧しないページのデータをやり取りしないので、データ通信量の削減効果が高い特長があります。 

簡単に変換できるの? そんなに圧縮できるの? 

お持ちのPDFファイルをオンラインで変換できる評価用のウェブサービスを提供しています。メールアドレスなどを登録することなく、その場で変換結果を確認したりHTMLファイルをダウンロードできます。くわしくはこちらの記事をご覧ください。 

PDFを廃止する必要はありません。PDFはファイルをPCなどに保存して閲覧や印刷する用途、主にオフライン用として提供します。ネットで閲覧するオンライン用にはHTMLという役割分担にします。 

PDF対HTMLの比較テストについて、以下で詳しく解説します 

「PDF軽量化」、「PDF圧縮」、「PDFファイルサイズ縮小」とは? 

PDFを取り扱っていると、わりとよく聞く言葉ですが、微妙にニュアンスが異なるようです。それぞれについて意味合いを整理しておきましょう。 

PDF軽量化とは 

  1. PDFのファイルの大きさ(ファイルサイズ、バイト数)を小さく・少なくすること
  2. PDFファイル内の不要な情報を取り除くこと
    ・旧バージョン向けのデータ、マルチメディア情報、添付ファイルなどを削除
  3. PDFファイルを開くまでの時間が少なくてすむようにPDFファイルを編集(加工)すること
    ・リニアライズドPDF化すると、一部のPDFビューアはPDFファイルの読み込み(ダウンロード)終了前に表示を開始 

PDF圧縮とは 

  1. PDFのファイルの大きさ(ファイルサイズ、バイト数) を小さく・少なくすること
  2. PDFファイル内の不要な情報を取り除くこと
    ・旧バージョン向けのデータ、マルチメディア情報、添付ファイルなどを削除 

PDFファイルサイズ縮小とは PDFを小さくするとは 

  1. PDFのファイルの大きさ(ファイルサイズ、バイト数) を小さく・少なくすること 

いずれも、できるだけ早くダウンロードや読み込みが終えられるよう、バイト数を減らす対策を指していることがわかります。でもこれって、ネットでPDFを見る利用者のニーズとは微妙にズレているかもしれません。 

ウェブ閲覧では、スマホとPDFは相性が悪い

取扱説明書や報告書のようなまとまった文書を公開するのにPDFは都合がよいので長らく使われてきました。しかしネットが普及し、閲覧者の過半数がスマホになったいま、PDFは時代に合わなくなっています。サイト制作者もその点に配慮して、手間がかかる対応をしています。

PDF閲覧へのスマホ利用者の不満

  • 見るのは一部のページだけなのにPDFファイル全体をダウンロードしないといけない
  • 見られるまでの待ち時間が長い
  • 見ないページのためのギガ消費が激しい

サイト制作者の不満

  • 章ごとに小分けしたPDF、場合によってはページごとのPDFに分割するのがたいへん
  • 小分けPDFへのリンクを載せるHTMLページの制作が手間

サイト制作者が手間をかけてPDFの欠点を補う努力をしていますが、PDF閲覧者に十分な満足を提供できてはいません。サイト閲覧者の不満を根本的に解消できるようになるとも思えません。考え方を変えた方がよさそうです。

実のところ、閲覧者にはPDF規格へのこだわりはありません。「PDFを見たい」のではなく、PDF内の「情報が見たい」のです。PDFに限界を感じたら、もっとよい方法に替えてもかまわないのです。HTML5やSVGといった、比較的新しいHTML規格に移行しましょう。

チャレンジ? いえいえ、すでに実績はたくさんあります。電子出版や電子ブック(電子カタログ、デジタルブック)などの世界では広く使われています。すでにほとんどの方が気付かないうちに利用しているはずです。主要なWebブラウザは標準設定で対応済みで、一般の企業や役所でも手軽に使える時期になっています。これまでのPDF資産をHTMLに移行させるツールがBuildVuなのです。

ネット閲覧でよく見る文書で比較テスト

PDF対HTMLの比較の条件と、結果の分析について説明します。

評価に採用した文書は、役所のガイドブック、機器メーカーの取扱説明書、技術系の書籍の3パターンを選びました。ガイドブックと取扱説明書はネットで公開されているPDFを、書籍は著者から提供を受けた内容見本PDFを使用しました。それらをBuildVuでHTML5に変換しました(デフォルト状態、オプション指定なし)。

HTML閲覧のシナリオ①は、(a)文書の1ページを表示して→(b)サムネールを見て読みたいページを探して→(c)そのページを表示するという閲覧を想定しています。表紙から閲覧するときや、検索エンジンで見つけた文書を閲覧する際の流れになります。

シナリオ②は、特定のページを指定する「直リンク」のURLが指定されている想定です。見るべきページがわかっている際の閲覧の流れになります。

シナリオ①②のいずれも10ページ目を表示しました。

  • 「東京くらし防災(英語版)」(東京都)
    「東京くらし防災」の日本語版は、分割したPDFを用意して、コンパクトなPDF化への配慮をしていました。しかし外国語版は一括PDF(82ページ)だけだったので、評価の対象としました。その結果、パターン①でPDFに比べてHTMLは 4.3% 約1/23に圧縮、パターン②ではPDF比 1.7% 約1/60に圧縮と、大きな効果が得られました。案内するメニューページに分割PDFのリンクが多数ならぶと見にくくなりますが、HTML化ならスッキリわかりやすくできます。
  • 「arrows Be4 Plus F-41B 取扱説明書」(docomo)
    パターン①がPDFにくらべてHTMLは18.4% 約1/5に圧縮、パターン②ではPDF比 16.7% 約1/6に圧縮できました。220ページもある取扱説明書なので、ごく一部を見る大多数の人にメリットを提供できます。
  • 「詳細! PHP 7+MySQL 入門ノート」お試しサンプル版(大重美幸)
    ほぼ全ページに図表がある技術系の書籍の62ページ分です。パターン①がPDFにくらべてHTMLは14.6% 約1/7に圧縮、パターン②ではPDF比 9.5% 約1/11に圧縮できました。電子書籍でもオンラインで検索して一部を読むなら、PDFよりHTMLの方がデータ量を減らせるとわかりました。

なおHTML化してもデータ量が減らない場合もあります。代表例としては、①全ページを閲覧するような場合、②多くのフォントを組み込んでいる場合、③数ページといった小ボリュームの文書の場合です。①はページごとにサーバとのやり取りが増える分がムダになります。②は、PDFはフォントを圧縮して記録しますが、HTMLでは非圧縮なのが理由です。③は、コンテンツ部分のHTMLのデータを減らせても、ビューアプログラム(JavaScriptなど)のデータ量が増える分で帳消しになるからです。

企業や役所のみなさま、これまで築いてきたPDF資産を、BuildVuを使ってHTML化して再活用してみませんか? この分野の代表ともいえるPDF→HTML変換ツールBuildVuで、正確な変換と付属ビューアによる快適な閲覧をぜひご体感ください。ぜひ、お手持ちのPDFファイルをオンライン変換してご検討ください(無料。メールアドレスなどの登録は不要です。末尾の手順をご覧ください)。

BuildVuについて

BuildVuは、雑誌や図面などをHTML5/SVGで“見た目”どおりに表示するツールとして20年以上の実績があります。PDFからHTML5/SVGへの変換ツール、HTML5/SVGビューアは、ぜひBuildVuにお任せください。
PDFからHTML5/SVGへの変換入門は、こちらをご覧ください

ぜひ今すぐにBuildVuで、あなたのPDFファイルをHTML5に変換してみてください。変換と専用ビューアでの閲覧をこちらからお試しいただけます(メールアドレスの登録不要、無料です)
BuildVuオンラインコンバーター※1
https://www.idrsolutions.com/ja/online-pdf-to-html5-converte

※1 開発元のIDRsolutions社の提供するサービスです。

    Facebook
    Twitter
    Email
    公式ブログロゴ

    製品に関する記事や開発者のブログ

    PDFってこうなってる? 実践でPDFの内部構造を学ぼう Part 7:色を操るグラフィックスステート

    今回は、画面に色を付けてみましょう。その過程で、グラフィックスステート(グラフィックス状態)について説明します。PDFファイルには、グラフィックスステートというデータ構造が関連付けられています。このデータ構造には、グラフィックスの描画方法を記述する情報が格納されます。現在の色や使用可能な色などの値がグラフィックスステートに保存されます。また、現在のクリップ、変換行列、線に対して行える面白い操作、ユーザー空間(PDFの座標系)からデバイス空間(モニター)へのグラフィックスの描画方法を変更するその他の命令など、様々な要素が含まれます。

    PDFってこうなってる? 実践でPDFの内部構造を学ぼう Part 6:パスで図形を描こう

    「Part 4: 白紙のPDFページを自作する」で示したように、PDFはストリームオブジェクト内にある一連のコマンドを使って描画されます。これらのコマンドを通じて、PDFビューアーはページ上に表示される全コンテンツを描画する方法を理解できます。この記事では、グラフィックコマンドを探究し、ページ上に数本の線を描画するPDFをテキストエディタで作成します。

    PDFってこうなってる? 実践でPDFの内部構造を学ぼう Part5:Hello WorldのPDFを作ろう

    「Part 1: PDFを理解するための第一歩」で、私はPDFファイルを構成するさまざまなオブジェクトについて説明しました。その中で言及したのがストリームオブジェクトです。ストリームオブジェクトは、PDFページの見た目を記述する命令を全て含んでいます。この記事の最後までに、私たちは「Hello World」のPDFを作成できるようになります。そのためには、PDFドキュメントにテキストを挿入するためのストリームオブジェクトを使う必要があります。

    PDFファイルを扱うシステム開発・ウェブ開発に役立つ

    開発者向けPDF入門ガイド

    開発者向けPDF入門ガイド

    PDFの基礎から応用まで開発者のための入門ガイド2024年版

    PDF の仕様や活用方法など、開発者に必要な情報がコンパクトにまとめました。初めてPDFを扱う開発者にも分かりやすく、基礎から応用までカバーしているため、PDF のポテンシャルを最大限に引き出し、アプリケーション開発やドキュメント管理の効率化を図るための手引きとなるでしょう。技術的な側面に興味がある開発者だけでなく、ビジネスでPDFを有効活用したい方にもおすすめの一冊です。

    MENU
    PAGE TOP
    ロボット
    PDFソフトウェアの開発に役立つ情報をメールでお届けします