[フォームデータ抽出]タブ


変換ユーティリティの[フォームデータ抽出]タブは、SmartWorkerオプション利用時のみ使用できます。

PDFファイルに含まれるフォームデータを抽出し、CSVファイルまたはXMLファイルに出力できます。

「フォームPDF指定」エリア

ファイル選択 / フォルダ選択 [ファイル選択]からPDFファイルを選択すると、選択したPDFファイルがファイルリストに追加されます。
[フォルダ選択]からフォルダを選択すると、指定したフォルダ直下にあるすべてのPDFファイルをファイルリストに追加します。サブフォルダは対象外です。
ファイルまたはフォルダを、リストにドラッグ&ドロップすることでも追加可能です。 
上へ / 下へ ファイルリスト内のPDFファイルの順番を変更できます。
並べ替え / …

[...]を押すと、ファイルリストの並べ替えについて設定できます。

[並べ替え]を押すと、[...]で設定された内容に従ってファイルリストの並びがソートされます。

削除 / 全削除 フォームデータの抽出を取りやめたいファイルがあれば、[削除]を押してファイルリストから削除します。
ファイルリストからすべてのファイルを削除するには、[全削除]を押します。

 

フォームデータは、ファイルリストの上から順に抽出されます。

「出力形式」エリア

CSV

PDFから抽出したデータを、カンマ区切りのCSVファイルとして出力します。

PDFファイル名(PDF FileName)、PDFのフォルダー名(PDF Folder)、抽出処理の結果(Result)は必ず出力されます。

CSV : PDFごとにファイルに出力(水平方向にデータ出力) 1つのPDFから抽出したフォームデータを、1つのCSVファイルに出力します。
ファイル名:<元ファイル名>.csv
1行目:項目名
2行目:データ
(例)Sample1.csv
PDF FileName, PDF Folder, Result, "txt_1", "txt_2"
Sample1.pdf, C:\test, Success, "空山", "太郎"
CSV : PDFごとにファイルに出力(垂直方向にデータ出力) 1つのPDFから抽出したフォームデータを、1つのCSVファイルに出力します。
ファイル名:<元ファイル名>.csv
1列目:項目名
2列目:データ
(例)Sample1.csv
PDF FileName, Sample1.pdf
PDF Folder, C:\test
Result, Success
"txt_1", "空山"
"txt_2", "太郎"
CSV : テンプレートPDFを指定し、全ファイルまとめて出力する 指定したテンプレートPDFのフィールド名と一致するデータを、リストのすべてのPDFファイルから抽出し、1つのCSVファイルにまとめて出力します。
ファイル名:<テンプレートPDFのファイル名>.csv
1行目:テンプレートPDFをもとにした項目名
2行目:テンプレートPDFのデータ
3行目以降:リストにあるPDFファイルのデータ
(例)Template.pdf
PDF FileName, PDF Folder, Result, "txt_1", "txt_2"
Template.pdf, C:\test, Success, "", ""
Sample1.pdf, C:\test, Success, "空山", "太郎"
Sample2.pdf, C:\test, Success, "雲野", "花子"
Sample3.pdf, C:\test, Success, "晴川", "次郎"

XML

XML : PDFごとにファイルに出力  [XML:PDFごとにファイルに出力]を選択すると、抽出したフォームデータは、XMLファイルとして出力されます。
出力されたXMLファイルの内容は、当社別製品SkyPDF ToolsSDK IIIのGetInputXmlData関数で取得できるXMLデータと同等です。

「テンプレートPDF指定」エリア

PDFリスト最上段のファイルをテンプレートPDFとする PDFリスト上にあるPDFのうち、最も上段にあるPDFをテンプレートPDFとします。
テンプレートPDFとするファイルを指定する [参照]を押してテンプレートPDFを指定します。

「出力フォルダ」エリア

指定したフォルダに出力する [参照]を押すと、CSVファイルまたはXMLファイルの出力先となるフォルダを指定できます。(最大文字数:244字)
存在しないフォルダや、書き込み権限がないフォルダに出力することはできません。 
元ファイルと同じフォルダに出力する 選択したPDFファイルと同じフォルダに出力されます。
[CSV:テンプレートPDFを指定し、全ファイルまとめて出力する]指定時は選択できません。 
テンプレートPDFと同じフォルダに出力する [CSV:テンプレートPDFを指定し、全ファイルまとめて出力する]指定時に選択できます。 

同名ファイルが存在した場合、連番を付与して出力する

このチェックボックスがオフの場合、出力先に同名ファイルが存在するときは、上書き保存されます。

このチェックボックスがオンの場合、出力先に同名ファイルが存在するときは、ファイル名の末尾に連番を付与して別名保存されます。 

エラーが発生しても処理を止めずに次の文書を処理する

エラーが発生したら処理は中断となり、その時点で残りのファイルの処理も中止されます。

このチェックボックスをオンにすると、エラーが発生しても処理を止めず、次のファイルの変換処理を続行します。

処理の結果は、ファイルリストの「状態」列で確認できます。

抽出開始

[抽出開始]を押すと、フォームデータの抽出を開始します。