デジタルカメラで撮影された写真画像を対象にOCR処理を行えるソフト。「スキャナを持っていない」ユーザも、デジカメ写真からテキストデータを得られる。「やさしくデジカメOCR」は、デジカメ写真を取り込み、文字部分をOCR処理してテキスト化できる“デジカメ専用”のOCRソフト。一般的なOCRソフトでは、イメージスキャナからの取り込んだ画像などを対象に文字認識を行うが、「やさしくデジカメOCR」では、スキャナの使用できない立体物や、ポスターや看板などを撮影したデジカメ写真からの文字認識も行える。認識エンジンは、メディアドライブ社のOCRソフト「e.Typist」のエンジンをカスタマイズしたもの。日本語・英語の認識に対応する。
特徴のひとつが、デジカメ写真を対象とするために、数多くの補正機能を搭載していること。写真画像に特有ともいえる「画像の傾き」の補正のほか、縦横の自動判定、ピンぼけや手ぶれの補正、コントラストなどの自動最適化など、一般的なスキャナ取り込みではあまり必要と思われない機能も備えている。さらに、ノイズ除去や白黒反転、減色、トリミング、タル型歪みの補正なども可能だ。
Windows標準の「ソフトウェアの選択ウィザード」にも対応する。Windowsでは、デジタルカメラをUSBで接続したり、SDカードやメモリースティックなどを装着したりすると「ソフトウェアの選択ウィザード」が自動的に表示される。ウィザード内に「やさしくデジカメOCR」が表示されるので、これを選択するだけで自動的に画像が取り込まれ、OCR作業を行えるようになっている。
「やさしくデジカメOCR」でデジタルカメラから写真を取り込むには「記録形式が(多くのカメラが採用する)DCFに準拠していること」などの条件がある。一度に最大50枚までの写真ファイルを取り込める。
OCR機能は、定評ある「e.Typist」の最新エンジンをデジカメ写真用に最適化したもの。レイアウトの自動認識はもちろん、レイアウト枠の認識順序指定、レイアウト枠の属性指定、表モード、辞書によるマッチング、ユーザ辞書、認識文字パターン辞書、自動学習など、さまざまなオプションを選択できる。認識言語は、日本語/英語/日英混在モードから選択することが可能だ。
認識結果は、プレーンテキストファイルのほか、Microsoft Word/Excel/PowerPoint、一太郎、Acrobat (PDF)形式ファイルとして出力できる。PDFでは、画像データの上に透明な文字枠を重ねる「透明テキスト」に対応するほか、データの圧縮率も指定できる。
読み取った文章を音声で読み上げる「自動読み上げ」機能も搭載。正しく認識されたかどうかを耳でも確認できる。さらに、認識結果をメール送信する機能もある。