fbpx
< 戻る
印刷

このPDF文書は構造化テキストのコンテンツを含んでいますか?

それはファイルによって異なります。

PDFには、ページ構造に関する情報を含む構造化PDFファイル(タグ付きPDF)と、構造情報を含まず、内容がどのような順序であっても構わない非構造化PDFファイルがあります。これはPDFが作成される際に行われ、 構造化されていない PDFファイルを構造化されたPDFファイルに変換することはできません。

PDF ファイルに構造化コンテンツが含まれているかどうかは、Adobe Reader でファイルを開き、[ドキュメント プロパティ] を表示することで判断できます。タグ付きPDFという詳細フィールドがあります。値がYesの場合、ファイルには構造化コンテンツがあります。

構造化についてはこちらの記事もご覧下さい。

PdfUtilitiesクラスには、PDFファイルがPDF仕様に従って完全にタグ付けされているかどうかをテストするメソッドが含まれています。

 

    MENU
    PAGE TOP