Google Drive の OCR(光学式文字認識)機能を試してみました。
Google ドキュメントの光学式文字認識について – Drive ヘルプ
スキャナで取り込んだり撮影した画像から、テキストデータを取り出すことができます。
01_画像をアップロードする
OCR にかけたい画像をアップロードします。ファイル容量は 2MB までという制限があります。

02_設定を変更する
アップロード中に画面右下に表示されるウインドウの「設定」をクリックして、「アップロードした PDF や画像ファイルからテキストに変換」にチェックを入れます。

03_テキストデータを取り出す
上が元画像で、下が OCR されたテキスト。まあまあの精度ですね。

日本語の文書も、横書きだったらまずまずの精度で認識されるようです。場合によってはものすごい怪文書になりますが、まぁそこは怪文書作成に役立つということで Google Drive の OCR は覚えておいて損はないはず。