Vector：速攻！ PDF to Data 2 ＆ from Paper 2 Pro

ベクターパスポートとは？

パソコンソフトを探すなら「Vector」: ソフトライブラリ; PCショップ; ベクターサイン

ショップで検索

その他のコンテンツ: ちょい読み!; SELECTION; Vector HOLDINGS Corporate Site

新着ソフトレビュー

2007.07.10

Vectorトップ > ライブラリ > 速攻！ PDF to Data 2 ＆ from Paper 2 Pro

このソフトをダウンロード・購入する

速攻！ PDF to Data 2 ＆ from Paper 2 Pro
画像データのPDF化とPDFデータの変換機能をセットにした“PDF活用ソフト”

■Windows Vista/XP　　■製品：試用可


	「PDF to Data 2」では、複数のPDFを異なる形式にまとめて変換できる
	◎そのほかのスクリーンショット画像ファイルやスキャンデータからPDFを作成する「PDF from Paper 2」 OCRの認識では、日本語を含む全10ヵ国の言語に対応する

スキャナから読み取った画像データをPDF化するツールと、PDFデータをWord/Excelで利用できるようにするコンバータがセットになったソフト。

「速攻！ PDF to Data 2 & from Paper 2 Pro」は、既存のPDFを読み取ってWord/Excelの書類形式で保存する「PDF to Data 2」と、OCRエンジンを利用してスキャナで読み取ったデータをPDF化する「PDF from Paper 2」の二つをセットにした、統合型PDFユーティリティソフト。

「PDF to Data 2」は、PDFデータをWord/Excel/テキストの各形式に変換できるソフト。PDFの各ページをBMP/JPEGの画像として出力する機能もある。変換元のPDFがWordやExcelから出力されたものである必要はなく、どんなPDFであっても処理できる。例えば、Wordの書類をもとにしたPDFをExcelの形式で出力し直すことも可能だ。

複数のファイルをあらかじめ指定しておき、これらを一度に変換する「連続ファイル処理」が行える。もちろん変換フォーマットやOCRで利用する言語は、ファイルごとに指定できる。「転送」指定により、変換後のデータをファイルに保存可能だ。

PDFに含まれている文字要素や画像などは、できる限り元のレイアウトやデザインを保ったままで変換される。文字色などの再現はもちろん、写真画像を含むPDFであれば画像が貼り付けられた状態で出力される。PDF内で「テキスト」として扱われている文字情報は、OCRを介さずに直接変換されるため“完全な状態”で出力ファイルに取りこまれる。

文字列が画像データとして含まれている場合は、内蔵のOCRエンジンにより文字を自動で認識する（元画像の品質により認識精度は異なる）。OCRの精度が高くなるよう、画像フィルタを適用したり、傾きを自動補正したりといった機能も備えている。OCRでは日本語のほか、ヨーロッパの国やロシア、韓国、中国語など10ヵ国の言語に対応する。言語をプロパティから選択することで、各言語に最適化された認識精度が得られる。

PDFだけでなく、BMP/JPEG/TIFFといった画像を入力データとして処理することも可能なので、いわゆる「OCRソフト」として使うことも可能だ。「ここだけOCR」機能により、Windows画面の一部をキャプチャする感覚でOCR認識させることもできる。認識された結果の文字列は、クリップボードなどに自動で転送される。

「PDF from Paper 2」は、イメージスキャナから取り込んだ画像を認識してPDF化する、PDF作成ソフト。スキャナ入力のほか、BMP/JPEG/TIFFといった既存の画像をソースにすることもできる。ファイル読み込みでは、最大128ファイルまでの連続処理に対応する。

TWAIN対応のイメージスキャナであれば「PDF from Paper 2」独自の認識ウィンドウからスキャン設定を直接変更できる。TIFFの読み込みでは「マルチページTIFF」にも対応するため、オフィスの複合機などで複数ページを一気に読みこんだイメージファイルからPDFを作成することも可能だ。

取り込んだ内容は、BMP形式の画像によって構成されたPDFとして出力される。PDFの「透明テキスト」機能により、OCRの文字列の結果を透明テキストデータとしてPDFに重ね合わせられるため、テキスト検索を利用できるPDFとして扱える。

ソフトライブラリからのおすすめソフト

不要なアプリケーションを跡形なく消去できる、使いやすいアンインストール支援ソフト
「GeekUninstaller」

実際のフォルダ構造にかかわらずファイルをわかりやすく分類・管理し、すばやく参照できる
「dINDEX.2」

64bit OSに完全対応。ハンターモードの改善なども図られた“強力”アンインストーラの新バージョン
「Revo Uninstaller Free」

シンプルなデザイン、軽快な動作、カスタマイズ自由度の高さが特徴の高機能メディアプレイヤー
「RE PLAYER」

日付ごとの出来事や予定などを“1行文章”でサッと書き込めるカレンダー＋メモ帳ソフト
「出来事帳」

reviewer's EYE

最近は、仕事の資料も各種機器の取り扱い説明書も、ほとんどのものがPDFで利用できるようになった。しかしそれはあくまで「最近の資料」に限られる。ちょっと古めの資料になると、いきなり「紙ベース」になったりするわけで、どの資料が紙ベースで、どの資料がPDFになっているのかをきっちり管理しておかないと、わからなくなったりもする。

こうした問題を解消するのであれば、やはり、いまだに紙ベースで残っている古い資料をPDF化するのがベストであろう。ところがこのPDF化というのが意外に面倒だ。「イメージスキャナでスキャンしてPDF化する」といってしまえば簡単なようだが、一連の手順をスムーズに進めるには、それなりにソフトが必要になってしまうし、自動化も必要だ。

しかも、単に画像として取り込むだけならスキャナの付属ソフトだけでも十分だが、PDF化するからには、文字列を検索できないと意味がない。PDFの「透明テキスト機能」は、地味ではあるが、これがないと話にならないというくらい重要な機能だ。

「速攻！ PDF to Data 2 & from Paper 2 Pro」のうち、スキャナで読み取った画像をPDF化するのは「PDF from Paper 2」の方だ。「PDF to Data 2」は、作成されたPDFをさらに別のソフトで読み取るためのもので、PDFを作成した「次のステップ」にあたる機能。両者はそれぞれ単品販売されることからもわかるように、完全に独立したソフトとして動作する。とはいえ、使い勝手は共通なので、どうせ導入するのであれば両方一度の方が便利であろう。

「PDF from Paper 2」も「PDF to Data 2」も、上で述べた「透明テキスト」に対応する。たまりにたまった紙ベースの資料を整理するためには、ぴったりのソフトだ。マルチページTIFFの読み取りに対応する点もうれしい。このソフトで、そろそろ手がつけられなくなってきた紙のデータを一気に処理してしまうのもよいのではないだろうか。

（天野司）

ソフト作者からひとこと

ソフトを開発しようと思った動機、背景
クロスランゲージは、翻訳ソフトの開発を中心に行っているソフトウェア会社です。「英語のPDFをレイアウトを崩さずに日本語に翻訳してほしい」というニーズに応えるため、まず「PDFダイレクト翻訳」という機能を開発しました。PDF内の英語のテキストを抜き出して日本語に翻訳し、PDFのレイアウトに戻します。この翻訳機能の開発中に「翻訳しないで、そのままWordやExcelに転送できると便利かも？」という発想から、「速攻！PDF to Data」の開発がスタートしました。

開発中に苦労した点
この製品は、「速攻！PDF to Data“バージョン 2”」です。バージョン1をご利用のユーザさまから、「Wordのテキストボックスを使わない方法で変換してほしい」という要望を最も多くいただきました。

PDFは、ワープロで作ったような行間や文字間隔が均等なものもあれば、DTPソフトやレイアウトソフトで作成された複雑なレイアウトのPDF、Macintoshで作成されてフォントが異なるPDFなど、多種多様です。多種多様な作られ方をしているPDFを、Word上に似せて表示させるために、最初のバージョンではワードのテキストボックスを使いました。テキストボックスを使えば、PDFに書かれているテキストの位置を調べて、Word上に配置すれば、オリジナルPDFと表面上は似た感じになります。しかし、テキストボックスで再現した場合は、テキストの編集がしづらくなるデメリットがあります。

今回のバージョン2では、Wordでのフラットなテキスト配置とレイアウトの保持の両立のチャレンジしました。まだまだ複雑なレイアウトの再現能力には改善が必要ですが、通常のレポート書類などのPDFは、格段に編集しやすくなっているはずです。ぜひ、体験版でお試しください。

ユーザにお勧めする使い方
新しくPDFファイルの右クリック→「Microsoft Wordに変換」の操作で、すぐに使えます。とっても便利です。ぜひ、ご利用ください。たくさんのファイルを一気に変換した場合や、韓国語、中国語など他言語のPDFを変換したい場合は「Pro版」がおすすめです。

今後のバージョンアップ予定
まだまだレイアウトの再現には改善が必要です。お使いいただいているユーザさまのご意見を参考に、どんどん進化させる予定です。

（（株）クロスランゲージ）

● 速攻！ PDF to Data 2 ＆ from Paper 2 Pro Ver.2.0.1
作　者　：　（株）クロスランゲージ　さん
対応OS　：　Windows Vista/XP
種　別　：　製品：試用可速攻！ PDF to Data 2 & from Paper 2 Pro DL版　PDFファイルをWord/Excel/Textに一発変換！画像データをPDFファイルに一発変換！　（193,670K）