Microsoft Office製品に組み込んで使用するアドイン型のOCR(光学文字読み取り)ソフト。スキャナから読み込んだ情報を文字情報化し、さらにOffice文書を作成できる。「ワンタッチOCR for Excel&Word」は、Microsoft OfficeのWord/Excel/PowerPointに組み込んで使用するOCRソフト。アドイン登録されたアプリケーションのメニューに「ワンタッチOCR」という項目が追加され、すばやくOCR機能を利用できる。新バージョンであるVer.2では、PDFファイルの認識をサポートし、PDF内の情報を再利用できるようになったほか、PowerPointからスキャナで取り込んだ情報を、簡単にPowerPointで再利用できるようになった。
データの読み込みから文書化までの操作は、全自動処理か、ステップごとにユーザが指示を行う方式かのいずれかを選択できる。例えば、Excelから「ワンタッチOCR」を利用する際は、次のような流れで行う。
- 1.取り込み方法の選択
- スキャナからの直接読み込み、既存の画像ファイルからの読み込み、PDFファイルからの読み込みを指定する
- 2.ソースの選択
- スキャナから読み込むか、画像やPDFファイルを指定する
- 3.原稿の向きの選択
- 読み込んだ画像の回転を行う
- 4.傾きの修正
- スキャン画像に傾きがある場合、自動検知して修正を行う。修正角度は、ユーザが数値で指定できるほか、プレビュー画面上をドラッグして指定することもできる
- 5.文字認識方法の選択
- 日本語の原稿、英語の原稿、英文や数字の多い日本語の原稿の3種類からいずれかを選ぶ
- 6.領域情報の修正
- レイアウトをブロック単位で判断し、各領域の大きさや縦書き・横書きなどを細かく修正できる
- 7.文字の修正
- 画像と認識結果を見比べながら文字を修正する。認識したテキストの音声読み上げや辞書のメンテナンスも行える
操作終了後、取り込みを実行することで、ワークシートが作成される。WordやPowerPointの場合も、ほぼ同様の流れになる。オプション設定では、取り込みに使用するデバイスの設定や原稿の種類(白黒/カラーなど)、認識結果を表示する際に記号やアルファベットなどの文字種ごとに色分け表示するためのカラー指定などができる。取り込み先のアプリケーションに応じて、次のような設定を行える。
●Wordの場合
- 取り込んだデータの挿入先:新規文書や現在の文書の末尾などから選択できる
- 取り込み形式:「テキストのみ」「段組みを再現」「レイアウトを再現」から選択できる
- 「テキストのみ」で表を読み込む場合のデータ区切り形式
- 半角で出力する文字
●Excelの場合- 取り込みデータの挿入先:「新規ワークシート」「新規ブック」「現在のセル」などから選択できる
- 取り込み形式:「データ利用(文字認識を重視する)」「レイアウトを再現(表の形を優先する)」から選択できる
- セル幅や罫線の再現方法
- 半角で出力する文字
●PowerPointの場合- 取り込みデータの挿入先:「新規プレゼンテーション」「プレゼンテーションの末尾」「現在のスライド位置」などから選択できる
- 取り込み方法:文字を認識するか、画像として取り込むかを選択できる
- 取り込んだスキャンイメージのスライド方法:「1イメージを1枚のスライドにする」「2分割する」「4分割する」「配布資料用として取り込む」などの指定ができる