TOPパソコン全般

無料のOCR「Google Drive」が定評のある980円の文字認識アプリに勝利!


日々進化しているGoogle DriveのOCRが有料アプリOCRに勝利

GoogleドキュメントのOCRが以前よりも精度が上がっていたので再度ご紹介します。
精度の上がり方は想像していたよりも上で、以前スマフォのアプリとして最高精度だとしてご紹介した980円の有料アプリ「e.Typist」よりも高かったです。



スマフォで手軽にOCR化したい方は以下のエントリーをご参考にどうぞ!
有料/無料のスマートフォン用OCRアプリ比較


恐るべしGoogle。
以前ご紹介した時とOCRの方法が若干変化しているので改めて説明します。

まず今回テストで使用したのは青空文庫からお借りした随筆銭形平次の一部分。
テキストをWordに貼り付け印刷したものをiPhone6で撮影しGoogleドキュメントにて文字認識させました。

比較として使用した「e.Typist」での文字認識のソースデータも同じものを使用しています。



ふりがなは見事にスルー。惑わされること無く認識した!

使い方の前にとりあえずGoogleドキュメントのOCR精度を御覧ください。
通常のテキスト羅列と違うのはふりがながある点。このふりがなが以前のGoogleドキュメントのOCRは苦手でしたが見事に誤認識を回避しています。

※赤文字はご認識部分
-----------------------GoogleドキュメントOCR-----------------------------

隨筆形平次 

捕物小説は楽し 野村胡堂 +目次

捕物小説というものを、私は四百二三十篇は書いているだろう。その上、近ごろは毎月五六篇は書いているから、幸いに私の健康が続く限り、まだまだこの多量生産は止みそうもない。
私が「銭形平次捕物控」という捕物小説を書いたのは、昭和六年ごろで、「オール読物」の創刊と同時であった。最初は勾論六回と十二回でよす積もりであったが、調子に乗って十何年か書き続け(その間半歳だけ休んだが)戦争末期のオールの廃刊まで に、実に百五十五回と書き続けた。
その後オールの復活とともにまた書き続けているし「新報知」その他の新聞雑誌に書 いたのを加えると、銭形だけで、 さっと三百
三読源くらいにはなってリろう。
ほかに「池田大助捕物日記」が約八十篇、韓信丹次、平柄銀次、隼の吉三などの 捕物帳がそれぞれ五六篇ずつ、 総計四百
ニ手士の捕物小説を書いているだろうと思 う。 我ながらいささかれ返っているが、 先日大次郎氏に逢ってその話が出ると、大氏は「人間業じゃないね」と酢っばい顔をしていた。化物扱いされるようになれば、作 者もまことに本懐の至りだ。
将棋の木村名人は、十数年間、
を並べていた友人の一人だが、 あの人は第 級の探偵小説ファンで、「あんな計をどうして考えるのだ」と幾度も私に訳いた。 「詰将棋の題を考えるようなものさ」といつでも私の答はきまっていた。ある科学者が、 同じ問いを私に出したとき、私はこう答えた。「数学の問題を考えるようなものですよ。
エックスイコールゼロ
X = 0から逆に考えていくのだ」と。

私の先生は、生前一度もお目 に掛かったことのない岡本堂先生であったといって 宜い。私の「銭形平次捕物控」は、 「半七捕物リ S刺載されて書いたもので、 私は筆 が行き詰まると、今でも「半七捕物帳」を出して何処ともなく読んでいる。「半七捕物帳」 は探偵小説としては淡いものだが、江戸時代の情緒を描いていったあの背景は素晴らしく、芸術品としても、かなり高いものだと信じている。

-----------------------GoogleドキュメントOCR-----------------------------


精度100%では無いものの有料アプリと比較しても精度は高い!

誤認識を回避とは言っても完璧では無いですね。
でもこの精度凄いんです。だって私が試した数種類のOCRアプリの中で最も優秀だった980円の有料アプリよりも精度が高かったんです。

有料アプリの結果は以下。


-------------------有料OCRアプリ 「e.Typist」-----------------------

随筆銭形平次

捕物小説は楽し

野村胡堂

+目次

捕物小説というものを、私は四百二三十篇は書いているだろう。その上、近ごろは毎月五六篇は書いているから、幸いに私の健康が続く限り、まだまだこの多量生産は止みそうもない。私が「銭形平次捕物控」という捕物小説を書いたのは、昭和六年ごろで、「オール読物」の創刊と同時であった。最初は勿論六回と十二回でよす積もりであったが、調子に乗って十何年か書き続け(その間半歳だけ休んだが)戦争末期のオールの廃刊までに、実に百五十五回と書き続けた。その後オールの復活とともにまた書き続けているし「新報知」その他の新聞雑誌に書いたのを加えると、銭形だけで、ざっと三百二十篇くらいにはなっているだろう。ほかに「池田大助捕記」が約ノ、備鴬勧次、平柄銀次響も吉三などの捕物帳がそれぞれ五六篇ずつ・総計四百二慕或9捕物小説を書いているだろうと思う我ながらし'ささか呆れ返つ事いるカミ・知大佛次郎氏に逢ってその言舌力・出ると、大佛氏は「人間業じゃないね」と酢っぽい顔をしていた。化物扱いされるようになれば、作者もまことに本懐の至りだ。将棋の木村名人は・+数年間・鴨弊並べていた友人の一人だがあの人は第一級の探偵小説ファンで、「あんな計をどうして考えるのだ」と幾度も私に訊いた。「詰将棋の題を考えるようなものさ」といつでも私の答はきまっていた。ある科学者が、曼顎駆9藷に出したとき・私はこう答えた。「数学の問題を考えるようなものですよ。X=0から逆に考えていくのだ」と。
私の先生は、生前一度もお目に掛かったことのない岡本綺堂先生であったといって宜い
私の「銭形平次捕物控」は「半七捕殉叢されて書いたもので、私1よ筆が行き詰まると、今でも「半七捕物帳」を出して何ともなく読んでいる。「半七捕物帳」は探偵小説としては淡いものだが、江戸時代の情緒を描いていったあの背景は素晴らしく芸術品としても、かなり高いものだと信じている。

-------------------有料OCRアプリ 「e.Typist」-----------------------

これでも「e.Typist」はかなり優秀なんです。他のOCRアプリと比べれば圧倒的に精度は高いのですがやはりふりがなに惑わされていることが分かります。

マジで凄いなGoogle! これだけの文字認識が無料で出来ちゃうなんて^^;


使い方のポイント紹介


アップロードはファイルでもフォルダ単位でも可能。ファイルも複数選択可

Google ドライブにログインしマイドライブをクリックすると以下のようにアップロード選択画面が出ますのでJPGやPNG、PDFなどのファイル等を選択します。
PDFは複数ページのものでもOKです。




ファイルを選択してOKすると画面の右下に以下のようなアップロード表示が出ます。
アップロードはさすがに早い!



アップロードされたものは最初のファイル形式のままで、まだOCR化はされていません。
ここが以前のGoogle Docsと違う点。
Google Docsの時はアップロード直後にOCR化されていたのですが現在は一行程必要です。



OCR化したいファイルの上で右クリック。
「アプリで開く」→「Googleドキュメント」を選択しクリック。




あとは数秒まてばドキュメント形式に変換されOCR化されたテキストが出てきます。





もしも上手く行かない場合は以下のポイントをチェック


「設定」を開き"アップロードしたファイルを変換する"にチェック

 


 「設定」→「言語」を確認。 既定の言語を確認する。 英語以外にも多言語が対応可
  

この2点さえ間違ってなければOCR化は成功するはずです。
Googleドキュメントを開こうとした時にエラーになる場合は時間をあけて再度試してみてくださいね。






パソコン全般 | 2016.10.15 [EDIT]

【関連するタグ】

【最新記事一覧】

12/09   「プリントヘッドの種類が違います」とプリンターに表示された時の対処方法と修理実例(mg/mpシリーズ) メンテナンスモードに入ることが肝か!?
12/02   チェキフィルムが堂々の1位 スマホ用レンズが114 円!など。 Amazonのランキング大賞2016が発表
11/28   ライティング大全とも言える100種類以上の照明機材比較資料が無料公開
11/17   NikonのD5600は何がD5500と変わったのか。Snap Bridgeやフレームアドバンスバーが追加!
11/16   BBC製作「Planet Earth II」の鳥肌動画の撮影風景が360度全天周動画で公開中!
10/31   自作の錯覚画像 作成するのも楽しいですね。え?同じ色?まさかソッチに?
10/24   今回の撮影は何mmレンズを持っていけば良い? こんな疑問を簡単に解決できる計算サイト
10/15   無料のOCR「Google Drive」が定評のある980円の文字認識アプリに勝利!
10/13   え?暗室を新たに建設した大学があるらしい。デジタル時代だからこそ生徒には大人気!
10/12   ラジオの時代再到来!無料で過去の番組が聴けちゃうRadikoのタイムフリー聴取がついに開始!
10/05   Adobe公式のPhotoshop&Illustratorショートカット早見表
09/28   Photoshopを使って簡単に"より自然な"ナチュラルHDR画像を作成できるダブルマスキング法 

【ポストカード写真】 Photo by 管理人(Orca)

<<今回の撮影は何mmレンズを持っていけば良い? こんな疑問を簡単に解決できる計算サイト | ホームへ | え?暗室を新たに建設した大学があるらしい。デジタル時代だからこそ生徒には大人気!>>
  • 【】
【// :】
| ホームへ |