-
まずはお試しください
-
BuildVuを実行する
-
Webサービスとクラウド
-
- マイクロサービスの設定
- Rubyを使ってBuildVuマイクロサービスにアクセスする
- Pythonを使ってBuildVu Microserviceにアクセスする
- PHPを使ってBuildVuマイクロサービスにアクセスする
- NodeJSを使用してBuildVuマイクロサービスにアクセスする
- Javascriptを使用してBuildVuマイクロサービスにアクセスする
- Javaを使ってBuildVu Microserviceにアクセスする
- cURLを使ってBuildVu Microserviceにアクセスする
- C#を使ってBuildVuマイクロサービスにアクセスする
- すべて表示 ( 4 ) 折り畳む
-
変換オプション
- クリップオフセット値の設定
- コンプリートドキュメント
- 画像の圧縮
- SVGの圧縮
- ページあたりの画像数のしきい値設定
- 画像をBase64ストリームとして埋め込む
- SVGをBase64画像として埋め込む
- インライン SVG
- 画像スケール
- コメントの無効化
- オリジナルのファイル名を作成する
- 起動アクションを有効にする
- フォントをテキストモードでラスタライズする
- 検索ファイルの生成
- ページ範囲の設定(論理ページ番号)
- ページ範囲の設定(実際のページ番号)
- 最大ページ高
- 最大ページ幅
- 1インチあたりのピクセル数
- スケール設定
- 収録フォントの設定
- 最小フォントサイズ
- 小さなテキスト除去のしきい値
- 出力するディレクトリ名の削除
- テキストを単語に分割
- テキストモード - textMode
- サムネイルの出力
- サムネイルの最大高
- サムネイルの最大幅
- レガシー画像ファイルタイプの使用
- ビューアのユーザーインターフェース - Viewer UI
- 表示モード
- パスワード
- すべて表示 ( 28 ) 折り畳む
-
テキストとフォント
-
IDRViewer-専用ビューア
-
アノテーション
-
ヒント&テクニック
-
困ったときの対処法
-
よくある質問
-
APIドキュメント
-
アップデート情報
- BuildVu 2024.10 Release Notes
- BuildVu 2024.08 Release Notes
- BuildVu 2024.07 Release Notes
- BuildVuマイクロサービスにおけるAPIの変更
- 白い線が表示される問題の改善
- BuildVu 2024.05 Release Notes
- BuildVu 2024.04 Release Notes
- BuildVu 2024.03 Release Notes
- BuildVu 2024.01 Release Notes
- BuildVu 2023.12 Release Notes
- BuildVu 2023.10 Release Notes
- BuildVu 2023.09 Release Notes
- BuildVu 2023.08 Release Notes
- BuildVu 2023.06 Release Notes
- BuildVu 2023.05 Release Notes
- BuildVu 2023.04 Release Notes
- BuildVu 2023.02 Release Notes
- BuildVu 2023.01 Release Notes
- すべて表示 ( 13 ) 折り畳む
-
- BuildVu 2021.05 Release Notes
- BuildVu 2021.06 Release Notes
- BuildVu 2021.08 Release Notes
- BuildVu 2021.09 Release Notes
- BuildVu 2021.11 Release Notes
- BuildVu 2021.12 Release Notes
- BuildVu 2021.04 Release Notes
- BuildVu 2021.02 Release Notes
- BuildVu 2021.01 Release Notes
- 2021.06リリースでのdivタグの変更点とその理由?
- すべて表示 ( 5 ) 折り畳む
-
- BuildVu 2019.12 Release Notes
- BuildVu April 2019 Release Notes
- BuildVu August 2019 Release Notes
- BuildVu February 2019 Release Notes
- BuildVu January 2019 Release Notes
- BuildVu June 2019 Release Notes
- BuildVu May 2019 Release Notes
- BuildVu October 2019 Release Notes
- BuildVu September 2019 Release Notes
- すべて表示 ( 4 ) 折り畳む
-
ライセンスとバージョン
search.json
search.jsonファイルには、文書全体のテキスト内容がJSON形式で記述されています。設定オプションで有効にすることができるオプションアセットです。IDRViewer Complete UI使用時(BuildVuの初期設定)に有効化されます。
基本構造:
[
"Text on page 1",
"Text on page 2",
"...etc"
]
目的:
search.jsonファイルの目的は、文書検索の簡略化です。すべてのHTMLやSVGページを読み込んで解析する必要がなく、ドキュメントの内容全体を簡単に検索する方法を提供します。
重要な相違点
search.jsonの内容は、以下の例外を除き、HTML/SVGの内容と完全に一致します。
1. HTML エンティティ
In the HTML and SVG content, アンパサンド &
, より大きい >
と より小さい <
の文字は、HTMLエンティティ& > <
に置き換えられるのに対し、search.json ファイルではそうではありません。
2. リガチャー
PDFファイルでは、グリフがffi → ffiのような複数文字の抽出値を持つ場合があります。これは合字によく見られることで、合字の外観は文体のために使用され、抽出値は分解された形となります。
このような場合、HTML/SVGコンテンツには合字フォーム(フォントが正しい外観を表示するために必要)が、search.jsonファイルには分解されたフォームが含まれます。
このとき、HTML/SVGには、DOMコンテンツとsearch.jsonコンテンツの対応付けを定義するdata属性が追加されます。例) <span data-mappings="[[13,'ffi']]">The ligature ffi decomposes to ffi.</span>
その他の注目情報
PDFファイルでは、テキストの見た目は正しいのに、抽出値が壊れていることがあります。これは、PDF作成ツールの設定ミス、PDFディスティラーの使用、あるいは作者が意図的にエンコーディングを壊して意味のあるテキスト抽出ができないようにした場合などに起こることがあります。これは文字化けと同じような結果になります。
このような場合、BuildVuは、壊れた値(制御文字や結合文字範囲にある場合がある)が文書の外観を壊すことを防ぐために、抽出値の再マッピングが必要になる場合があります。
このような場合、BuildVuはフォント内のPUA(Private Use Area)に文字を再マップすることがあります。このような文字がHTMLやSVGで表示される場合、フォントによって文字が正しく表示されるようになります。しかし、このような文字をフォントなしで表示する場合(例:検索結果のスニペットとして返される場合)、文字の外観が正しくなくなります。
多くのアプリケーションでは、私用領域範囲 (U+E000–U+F8FF
) の文字は通常 .notdef glyphとして表示されますが、これは保証されていません。