Googleドキュメントに文字(日本語)を含んだ画像をアップロードする際に、
「PDFや画像ファイルからテキストをGoogleドキュメントのドキュメントに変換する」にチェックを入れて、言語として「日本語」を選択するとアップロードされた画像の下に読み込んだ文字がテキストとして上図のように保存される。
この機能はEverNoteでも少し前から追加されていたので、Googleも追従したのだろう。僕はEverNote派ではなくもっぱらGoogleNoteを使っているのでうれしい機能追加と言える。
さてOCR機能の認識率はどうだろう?正しく読めなかった部分をチェックすると
- 英数字の数字
- カラーのアンダーラインが付いた部分
- 黒以外のカラー文字
- 明朝体は苦手か?
まあ、大した認識率ではないが日本語の認識をOCRソフトで行う場合も白黒モードで600dpi以上でスキャンしなければならない事からすれば、WEB上にあった解像度の低いカラー画像から、これだけ読めればまあまあなのかな?