株式会社インターワーク

PDF用語集 -- PDF開発で知っておきたい重要用語を網羅的に解説

AcroFormからXObjectまで、PDF開発・PDF仕様に関する重要用語をアルファベット順にわかりやすく解説。フォント、圧縮、暗号化、カラースペースなど幅広い分野をカバーしています。

(更新:
PDF用語集 -- PDF開発で知っておきたい重要用語を網羅的に解説

この記事ではPDF関連の一般的な用語を網羅し、それぞれの定義を解説します。

1,300用語以上を収録した完全版PDF用語集を公開しています。 本記事で紹介している用語に加え、より詳細な解説と実装例を含む包括的な用語集をIDRサポートポータルで公開しています。PDF開発の実務でお役立てください。

PDF用語集(完全版)を見る →

A

AcroForm

AcroFormは、PDF 1.2で導入されたPDFフォーム形式です。カタログ(/Catalog)に追加される辞書(/AcroForm)を使用します。

アクション(Action)

アクションは、ユーザーの操作やイベントによって自動的にトリガーされる動作です。一般的には、異なるページへのナビゲートやマルチメディアコンテンツの再生に使用されます。

Adobe Inc.

Adobe社は、オリジナルのPDFファイル形式を作成し、主要なソフトウェアを開発しました。現在、PDFの標準はオープンになっていますが、Adobeは依然として主要なプレイヤーです。

AES

Advanced Encryption Standard(高度暗号化標準)は、情報を保護するために使用される暗号化アルゴリズムです。

代替テキスト(Alt text)

代替テキスト(通常はaltテキスト)は、画像の説明文であり、アクセシビリティ技術によって使用されます。

注釈(Annotation)

注釈は、ページ上に配置され、ユーザーが操作できるメモ、リンク、またはリッチメディアです。

アンチエイリアシング(Anti-aliasing)

アンチエイリアシングは、ラスタライズされたコンテンツのエッジを滑らかにする技術です。

AP

APはAppearance(外観)の略で、インタラクティブな要素がどのように表示されるかを定義します。APエントリは通常、ストリームまたはリソース辞書を含みます。

承認署名(Approval signature)

承認署名は、文書の変更を検出し、文書の署名者を確認できるデジタル署名です。

Arlingtonモデル

Arlingtonモデルは、すべてのPDFオブジェクトの機械可読なモデルです。

配列オブジェクト(Array object)

配列オブジェクトは、0から始まる順序で配置された一次元のオブジェクトのコレクションです。

アーティファクト(Artifact)

アーティファクトは、アクセシビリティ技術によって読み取られることを意図しない文書内の情報を提供します。

ASCII

American Standard Code for Information Interchange(米国情報交換標準コード)は、128文字の特定のセットをバイナリ数としてエンコードするための一般的な規約です。

AVIF

AV1 Image File Format(AVIF)は、画像を保存するためのフォーマットで、HEICに似ています。AVIFは、AV1ビデオコーデックをベースにした高効率の画像形式です。

B

バイナリデータ(Binary data)

バイナリデータは、意味を持つために通常コンテキストを必要とするバイトのシーケンスです。

ブレンド(Blending)

ブレンドモードは、2つの色が重ねて描画されたときに何が起こるかを定義します。

BMP

BMPは、ラスターグラフィックス画像ファイル形式です。

ブックマーク(Bookmarks)

ブックマークは、アウトラインの非公式な名称です。

ブールオブジェクト(Boolean object)

ブールオブジェクトは、trueまたはfalseのいずれかを表します。

バイト(Byte)

バイトは、8ビットのバイナリです。

C

カタログ(Catalog)

カタログは、文書の内容、アウトライン、記事のスレッド、名前付きの宛先、その他の属性を定義する他のオブジェクトへの参照を含みます。

CCITT

CCITTは、通常モノクロ画像に使用される可逆圧縮アルゴリズムです。

証明書(Certificate)

証明書は、デジタルコンテンツの真正性を証明します。

認証署名(Certification signature)

認証署名は、承認署名と非常に似ていますが、署名後の特定の操作をブロックする機能があります。

文字(Character)

文字は、エンコーディングによって定義された、文字、数字、または記号を表す数値コードです。一般的なエンコーディングには、ASCIIやUTF-8があります。

CIDフォント(CID fonts)

CIDフォントは、大規模な文字セット(特に中国語、日本語、韓国語)をサポートするために開発されたフォント形式です。CIDはCharacter Identifierの略です。

CMYK

CMYKは減法混色のカラーモデルで、シアン、マゼンタ、イエロー、キー(ブラック)を使用します。

カラースペース(Color spaces)

カラースペースは、異なるデバイスや出力で再現性のある結果を可能にする色の集合です。

コメント(Comment)

PDFファイル内のコメントは、ファイルを説明または注釈するために使用される機能です。%記号を使用して書かれます。

圧縮オブジェクト(Compressed object)

圧縮オブジェクトはPDF 1.5で導入され、オブジェクトをバイナリストリームに格納し、それを圧縮することができます。

コンフォーマンス(Conformance)

コンフォーマンスは、PDFがPDF仕様の特定のサブセットのルールに準拠しているかどうかを指します。一般的なサブセットには、PDF/AやPDF/Xがあります。

コンテントストリーム(Content stream)

コンテントストリームは、ページ上に描画されるグラフィカル要素を含みます。

COS

Carousel Object Syntaxは、PDFファイル内でオブジェクトを記述するために使用される構文を指します。

クロスリファレンスストリーム(Cross reference stream)

クロスリファレンスストリームはPDF 1.5で導入され、クロスリファレンスセクションをストリーム内で定義し、スペースを大幅に節約します。

クロスリファレンスセクション(Cross reference section)

クロスリファレンスセクションは、PDFファイル内のオブジェクトとそれらのファイル内の位置を一覧表示するセクションであり、トレーラーの前に配置されます。

D

DCT

離散コサイン変換(Discrete Cosine Transform)は、JPEGやWebPで一般的に使用される数学的変換で、圧縮アルゴリズムの基礎となります。

廃止(Deprecated)

廃止と記載されたものは、今後サポートされない可能性があるため、使用が推奨されません。PDFの廃止された機能は、現代のPDFプロセッサーによって無視されることが多いです。

辞書オブジェクト(Dictionary object)

辞書オブジェクトは、他のオブジェクトのキーと値のペアを含みます。

直接オブジェクト(Direct object)

直接オブジェクトは、間接オブジェクトの反対で、オブジェクトデータをその場に記述します。

ドキュメントパート(Document part)

ドキュメントパートは、関連するページの集合です。

ドキュメントパート階層(Document part hierarchy)

ドキュメントパート階層は、多数のドキュメントパートを組織化します。

E

EOLマーカー(EOL marker)

新しい行を作成するために使用される空白文字です。行の終わりには、キャリッジリターン(\r)またはラインフィード(\n)、またはその両方が使用されます。

EXIF

EXIFは、画像ファイルのためのメタデータ形式です。

F

FDFファイル

Forms Data Formatファイルは、PDFフォームからのフォームデータと注釈データを保存します。

フィルター(Filter)

フィルターは、ストリームをエンコードすることを可能にし、通常はスペースを節約します。

フォント(Font)

フォントは、書体を実現するための実装です。

フォントプログラム(Font program)

フォントプログラム(フォントファイルとも呼ばれる)は、フォントをどのように描画するかを記述したファイルです。

フォーム(Form)

PDFフォームは、ユーザーが個人情報を入力できる記入可能なフィールドやその他のインタラクティブな機能を含みます。

G

世代番号(Generation number)

世代番号は、同じオブジェクトの異なるリビジョンを表す正の整数です。ほとんどの場合、その値はゼロです。

GIF

GIFは、アニメーション画像をサポートする可逆圧縮の画像形式ですが、色数が256色に制限されています。

グリフ(Glyph)

グリフは、文字、数字、または抽象的な記号の具体的な視覚形態です。

グラフィックスステート(Graphics state)

グラフィックスステートは、現在実行中のグラフィックスオペレータに影響を与えるグラフィックス制御パラメータのスタックです。

H

HEIC

High Efficiency Image File Formatは、Appleが開発した高効率の画像形式です。オープン標準ですが、主にAppleデバイスで使用されています。

ヒンティング(Hinting)

フォントヒンティングは、フォントの表示を調整し、ラスタライズされたグリッドに合わせるための指示を指します。

HTML

HyperText Markup Languageは、ウェブブラウザで表示するためのウェブページを作成するための言語です。通常、JavaScriptやCSSと共に使用されます。

I

インクリメンタルアップデート(Incremental updates)

インクリメンタルアップデートは、PDFファイル全体を変更することなく更新できることを指します。変更はファイルの末尾に追加されます。

間接オブジェクト(Indirect object)

間接オブジェクトは、オブジェクト識別子でラベル付けされ、キーワードobjendobjの間にあります。

整数オブジェクト(Integer object)

整数オブジェクトは、分数部分を持たない正または負の整数を含むオブジェクトです。

ISO 32000

ISO 32000は、PDFファイル形式を定義する技術仕様書です。

J

JavaScript

JavaScriptは、ウェブサイトで一般的に使用されるプログラミング言語ですが、PDFファイル内でもフォームの検証やインタラクティブな要素のために利用できます。

JBIG2

JBIG2は、2色(通常は黒と白)の画像のための画像圧縮標準です。

JPEG

Joint Photographic Experts Groupは、非常に一般的な不可逆圧縮の画像ファイル形式です。

JPEG 2000

JPEG 2000(JP2またはJPXとも)は、JPEGの後継として設計されたファイル形式です。

JPEG XL

JPEG XLは、最新の画像ファイル形式であり、JPEG 2000よりも優れた圧縮と品質を持つことを目的としています。

K

カーニング(Kerning)

カーニングは、個々のグリフ間のスペースを調整することを指します。

キー(Key)

  1. 辞書キー: 辞書で使用されるキー-バリューペアの一意の識別子。
  2. 暗号キー: メッセージを暗号化または復号化するために使用されるキー。

L

リニアライズドPDF(Linearized PDF)

リニアライズドPDFは、文書がストリーミングされているときに、より効率的なページ読み込みを可能にするように整理されたPDFです。

可逆圧縮(Lossless)

可逆圧縮を使用すると、データは解凍時に完全に再現できます。

不可逆圧縮(Lossy)

不可逆圧縮を使用すると、データは解凍時におおよそ再現されます。これは圧縮サイズ、速度、品質のトレードオフです。

LZW

Lempel-Ziv-Welchは、GIF画像で一般的に使用される可逆圧縮アルゴリズムです。

M

メタデータ(Metadata)

メタデータは、他のデータに関する情報を提供するデータです。

N

名前オブジェクト(Name object)

名前オブジェクトは、スラッシュ(/)に続く一連の文字で表されるシンボルです。

ネームツリー(Name tree)

ネームツリーは、すべてのキーが文字列であり、順序付けられているという点で、辞書に似ています。

ヌルオブジェクト(Null object)

ヌルオブジェクトは値を持たず、キーワードnullで表されます。

ナンバーツリー(Number tree)

ナンバーツリーは、すべてのキーが整数であり、順序付けられているという点で、辞書に似ています。

数値オブジェクト(Numeric object)

数値オブジェクトは、整数オブジェクトまたは実数オブジェクトのいずれかです。

O

オブジェクト(Object)

オブジェクトは、PDFファイル内で情報を表すために使用される基本的なデータ構造です。

オブジェクト番号(Object number)

オブジェクト番号は、PDFファイル内の各オブジェクトに一意に割り当てられたゼロより大きい整数です。

オブジェクト識別子(Object identifier)

オブジェクト識別子(オブジェクト参照とも呼ばれる)は、オブジェクト番号と世代番号で構成されます。

OCR

光学文字認識は、手書きまたは印刷されたテキストを機械可読なテキストに変換するプロセスです。

オペレータ(Operator)

PostScriptオペレータは、PDFファイル内のストリームで使用され、コンテンツをレンダリングするための指示です。

OpenType

OpenTypeフォントは、MicrosoftとAdobeによって共同開発され、TrueTypeフォントから派生しています。

アウトライン(Outline)

PDF文書のアウトラインには、ページやセクションの構造が含まれ、目次のようにナビゲートに使用できます。

P

PDF

Portable Document Formatは、デバイスに関係なく文書を一貫して表示するために設計されたファイル形式です。

PDF Association

PDF Associationは、PDFファイル形式をサポートし、開発するオープンな業界団体です。

PDFプロセッサー(PDF Processor)

PDFプロセッサーは、PDF仕様に準拠しながら、PDFファイルを読み書きできるソフトウェアです。

PDFバージョン(PDF version)

PDF仕様の異なるバージョンが利用可能で、新しいものほど洗練され、最新の機能が含まれています。

PDF/A

PDF/Aは、長期的な文書保存と最大数のデバイスでの互換性のために設計された形式です。

PDF/E

PDF/Eは、3Dモデルの埋め込みをサポートするために設計されたエンジニアリング用途の形式です。

PDF/R

PDF/Rは、複数ページのラスタ画像を保存するために設計された形式です。

PDF/UA

PDF/UAは、アクセシビリティ技術と連携するために設計された形式です。

PDF/VT

PDF/VTは、PDF/Xの拡張で、バリアブルデータ印刷をサポートします。

PDF/X

PDF/Xは、グラフィックデザイナーや印刷業者によって一般的に使用される形式です。

PNG

Portable Network Graphicsは、インターネットで一般的に使用される可逆圧縮の画像形式です。

PostScript

PostScriptは、電子文書で使用されるページ記述言語です。PDFは、その簡略化されたバージョンに基づいています。

プリフライト(Preflight)

プリフライトは、PDF文書が指定された条件に準拠していること、および印刷生産の準備ができていることを確認するための検査を指します。

R

ラスター(Raster)

ラスターは、画像を表すための色データを含むセルのマトリックスです。

実数オブジェクト(Real object)

実数オブジェクトは、範囲と精度が限定された浮動小数点数です。

矩形(Rectangle)

矩形は、ページ上の位置やバウンディングボックスを記述する配列オブジェクトです。

墨消し(Redaction)

墨消しは、機密情報を公開せずに文書を公開できるように、文書の一部を検閲することです。

リソース辞書(Resource dictionary)

リソース名をそのオブジェクトと関連付けます。

本文テキスト(Running text)

本文テキストは、文書の本文内の主要なテキストです。

S

SHA

Secure Hash Algorithmは、パスワードを保護するために一般的に使用される暗号学的ハッシュ関数です。

署名ハンドラー(Signature handler)

署名ハンドラーは、デジタル署名の作成を実装するソフトウェアです。

sRGB

sRGBは、非常に一般的に使用される標準的な赤、緑、青のカラースペースです。

ストリームオブジェクト(Stream object)

ストリームオブジェクトは、辞書に続いてバイナリデータを含みます。

文字列(String)

文字列は、一連の文字です。

構造化テキスト(Structured text)

構造化テキストは、テキストのレイアウトがどのようになっているかについての追加情報を含みます。

T

タグ付きPDF(Tagged PDF)

タグ付きPDFファイルは、そのコンテンツがどのように構造化されているかに関する情報を含みます。

TIFF

Tag Image File Formatは、1つ以上の画像を保存できる形式です。

トレーラー(Trailer)

トレーラーは、PDFファイルの末尾にある辞書です。最大のオブジェクト参照、ドキュメントカタログ、情報メタデータオブジェクトなどが含まれます。

TrueTypeフォント

TrueTypeフォントは、AppleとMicrosoftによって設計されました。

Type 1フォント

PostScript Type 1フォントは、PDFファイルで最も一般的に使用されるフォントです。

Type 3フォント

PostScript Type 3フォントは、グリフが完全なPostScript言語によって定義されています。

U

Unicode

Unicodeは、ユニバーサル文字集合にマップされる一連の文字エンコーディングを指します。

非構造化テキスト(Unstructured text)

非構造化テキストは、そのレイアウトにモデルや構造がなく、単にテキストです。

UTF-8

Unicode Transformation Format-8は、最も一般的に使用される文字エンコーディングであり、ASCIIと互換性があります。

V

ベクター(Vector)

ベクターは、方向と大きさなどの2つの次元を持つ量です。PDFの文脈では、拡大・縮小しても品質が劣化しません。

W

WebP

WebPは、Googleによって作成された画像形式です。

空白文字(Whitespace character)

空白文字は、印刷されないがテキスト内で意味を持つ文字を指します。

X

XFA

XML Forms Architectureは、PDF 1.5で導入されましたが、PDF 2.0で廃止されました。

XFDF

XFDFは、FDFファイル形式と非常によく似ていますが、データがXMLとして表現されます。

XML

Extensible Markup Languageは、任意のデータを格納するためのファイル形式です。

XMP

Extensible Metadata Platformは、ファイルに関する情報を格納するXMLベースのメタデータ形式です。

XObject

XObjectは、一連のグラフィックスオブジェクトのコンテナです。

Z

Z-Index

Z-Indexは、重なり合う要素の順序を指します。PDFでは、後に描画された要素が前面に表示されます。

参考文献

  • ISO 32000-2:2020-12 PDF 2.0仕様書
  • PDF Association PDF用語集
開発者向けPDF入門ガイド 表紙
無料 eBook / 25p

開発者向けPDF入門ガイド

PDFの仕様や活用方法など、開発者に必要な情報をコンパクトにまとめました。初めてPDFを扱う開発者にも分かりやすく、基礎から応用までカバーしているため、PDFのポテンシャルを最大限に引き出し、アプリケーション開発やドキュメント管理の効率化を図るための手引きとなるでしょう。

ご興味のある製品:

ご入力いただいた情報は、eBookの送付およびインターワークからのご案内にのみ使用いたします。プライバシーポリシー