画像データに含まれる文字列を抽出してテキスト化するOCRソフト。ソフト名からわかる通り、Microsoft Word/Excelでの利用に特化し、紙原稿をスキャナで取り込んで、Word/Excel用のデータに出力するまでをワンタッチで行えるのが特徴。細かな設定を行って、確認しながら取り込むこともできる。インストールすると、WordおよびExcelのツールバーに「取り込み」「設定」というボタンが追加される。「取り込み」ボタンから「ワンタッチOCR」を呼び出して取り込まれたデータは、そのままWord/Excelの編集画面に貼り込まれるため、一般的なOCRソフトのように、いったんデータファイルとして保存する必要はない。もちろん、編集画面のデータはそのままWord/Excelで編集できる。既存の画像ファイルからの取り込みでは、BMP/TIFF/PCX/JPEG/PNGの各形式に対応する。
取り込み後のデータ編集に便利なよう、Wordでは「レイアウトを再現」など3種類、Excelでは「データ利用」「レイアウトを再現」の2種類の取り込みモードが用意されている。「レイアウトを再現」では、テキスト情報はもちろん、罫線などを含むレイアウトを元原稿に近い形で取り込める。罫線も、直線だけでなく、点線や波線といった線の種類や、文字の位置、サイズなども元原稿に近い形で再現される。「データ利用」では、レイアウトを再現するのではなく、1セルに1データずつを取り込んで出力するため、Excelで編集しやすい。Wordでは、テキストのみを取り込むモードも用意されている。
ソフト名が示す通り、取り込みはワンタッチで行える。通常、スキャナで紙原稿を読み込む場合は、専用のドライバで読み取り枠を設定したり、読み取り解像度を指定したりといった操作が必要だが、「ワンタッチOCR」ではこうした設定をまったく行わず、“全自動”で取り込める。細かな設定を行いたい場合は、ステップごとに確認しながら認識を実行する「ステップ実行」を利用できる。「ステップ実行」では、低コントラストの原稿や複雑なレイアウトの原稿なども、手動で補正しながらOCR作業を行える。
ソフトの基本となるOCRエンジンは精度が高い。日本語辞書はもちろん、英語辞書は米語・英語の辞書を内蔵し、認識精度を高めている。そのほか、罫線と文字が密着していたり近接していたりする場合でも、できる限り正しいデータを再現できる。縦書き原稿にも対応する。また、フォントの形状により誤認識しやすい文字を登録して、回避する機能なども備えている。