文字起こしの時
Macで画像の文字からテキストへ変換する
OCRを探していたら
WEBサービスでかつ無料で
結構認識率のよい物が見つかりました。
とても高機能で、日本語、外国語にも対応してます。
無料で未登録の場合
いくつか制限がありますが
1ページなら登録しなくても
問題無く使えます。
実験した感じでは、画像の文書形式なら
ディスプレイ画面に表示された
画像の文字は
スクリーンキャプチャ(
ほぼ普通のテキストに変換される
感じです。
Macのアプリ系OCRが動かなくなったり
して困った時に
とても重宝すると思いますし
当然Windowsも使えます。
使ってみた感じがすごくよかったので
いくつか使い方を書いてみます。
OCRとは?をわかりやすく説明しフリーアプリソフトで無料のGoogleドキュメントを使ってMacでOCRの工夫,スマホやカメラを使ったやり方やできないときの応用編と連続PDFの作成と処理の方法をまとめてみました
テスト環境
WEB上のオンラインサービスなので環境は
あまり関係ないですが書いておきます。
パソコンが
インターネットに繋がっているのが条件です。
OnlineOCR(←こちらがそのサービスです)
登録なしの場合は15mbまで
https://www.onlineocr.net/
Mac OS X 10.11.6 El Capitan
MacBook ProRetina, 15-inch, Mid 2015
ブラウザー Google Chrome
Xperia XZ1 Compact SO-02Kの標準カメラも使用
スクリーンキャプチャは「command+shift+4」を使用
使い方
OnlineOCRのページを表示
図
図
今回の画像ファイルは「灘」で検索した結果の画面を使用してます。
そうすると、以下のBOXにテキスト表示されてでてきます
コピペしてもいいですし
ダウンロードしてもOKです。(Download Output File)
今回はこの灘の文字を検索したブラウザーから
commcd+shift+4でキャプチャした画像を選択しました。
図
以下がそのテキストの文面です
図
灘-Wikipedia https :1/ja. wi ki ped Ia. org/wi ki/灘▼ 灘(なだ)は、沖合の中で波が荒く、潮流が速い所を指す。洋とも書き表される。さんずいに難という 字の如く、古くから航海が困難な場所とされ、そのため沿岸には避難港が発達している。とりわけ、黒 潮(日本海流)が流れる太平洋側に多く分布する。その反面、 玄海灘・遠)吋灘・播磨灘・鹿島灘
いくつかのドットやスペースの間違い
漢字の認識間違いがありますが
あとはパソコン画面上での訂正入力作業になります。
この位の認識率だと
入力はとても楽になると思います。
以下のページの警告文もこのOnlineOCRを使いました。
おかげで日本語、英語、入力の手間が
ずいぶん軽減されました。
あなたのシステムは3つのウイルスに感染しています!がでました,それも英語で,orz..パソコン,スマホ
図
興味があれば実験しながら、試されてみてください。
クリックし画像を表示させてキャプチャしてください。
図
たぶん、認識率の高さに驚くかと思います。
単文字でのテスト
1文字でのテストでは認識しないようで。(テストでは)
図
文書を前提に考えられているソフトのようです。
以下の様に
横に何文字か入れると、最適フォントサイズの場合うまく認識するようです。
(今回はスペースを入れて、少し上下の余白部分を取り入れてます)
図
その他の言葉、
図
上記は認識しません。(今回のテスト)
文字間の狭いエディターの場合認識率が落ちるようです。
うまく行かない場合は
認識されたテキストなし(機械翻訳です)
と表示されます。
手書き1文字も認識しない感じでした。(テスト中)
No recognized text ! は、この場合
日本語としては、「うまく認識できません」でしょうか。
認識させるにはある程度の文書量、文字数が必要なようで
文字の間のスペースが大事な要素のようです。
以下は認識します
図
無駄/徒(ムダ)とはーコトバンク https://kotoban k.j p/word/無駄-641862 ▼ デジタル大辞泉-無駄/徒の用語解説-「名・形動」
いこと。また、そのさま。無益。 れもーもいっかう言はず」(滑・
「一な金を使う」
1役に立たないこ 「時間をーにする」
と。それをしただけのかいがな 2 「むだぐち」に同じ。「しゃ
膝栗毛・初)「補説」「無駄」は当て字。
スマホカメラでのテスト
先ほどの画像を使って
ディスプレイに表示した画像をスマホのカメラで撮影し
適度な大きさに表示して、スクリーンキャプチャして
OCRへかけます
図、図
灘-Wikipedia https :1/ja. wi ki ped Ia. org/wi ki/灘▼ 灘(なだ)は、沖合の中で波が荒く、潮流が速い所を指す。洋とも書き表される。さんずいに難という 字の如く、古くから航海が困難な場所とされ、そのため沿岸には避難港が発達している。とりわけ、黒 潮(日本海流)が流れる太平洋側に多く分布する。その反面、 玄海灘・遠)吋灘・播磨灘・鹿島灘
スマホカメラでの撮影なので
すこし斜めになっており、
さらに色ムラのある画像でも
普通に認識しているのが
すごいかもです。
スマホのカメラやデジカメの画像は
容量が大きく、肥大化しているので
たぶん、
OCRの最適化サイズの調整が必要と思います。
(そのままでもある程度認識はするようですが、時間もかかります)
それぞれのご自分のパソコンで至適サイズを検証されてみてください。
この技術を使うと、読めない漢字も編集して、文書化すると
うまく認識した場合は読めることもあります。
新聞の場合
写真はスマホのカメラを使用し撮影していて
さらにそれをスクリーンキャプチャしてます。
図
ルからもたらされた。 カタールからは同午後9 時ごろ、安田さんとみられ る男性が解放され、トルコ のアンタキヤの入管施設に いると連絡があったとい う。 安田さんは取材のため15 年6月、トルコ南部ハタイ 県からシリア北西部イドリ ブ県に越境後、消息を絶っ た。16年3月に安田さんと
みられる男性が英一」」でメッ セージを読み上げる映像が 公開。同年5月には「助け て」と日本語で書いた紙を 示す画像も公開された。今 年7月にも安田さんとみら れる複数の映像が出た。
英語の部分が誤認識されてますが
かなりの認識率です。
カメラで撮った画像のOCRは
なかなかいい物がみつからなかったので
これはかなりいいと思います。
PDFの方法やその他参考
PDFも同じように、パソコン画面に表示して
スクリーンキャプチャを使用して
上記方法と同じように認識出来ます。
スマホアプリ
CamScanner Freeの説明
スマホで雑誌をスキャンしてみた,CamScanner Freeの使い方や読みにくいのか等?
あとがき
今まで、
有料、無料のOCRをいろいろ使いましたが
数年前まで使っていて
スキャナーについているもので
割と認識率がよくて
とても、重宝していたのですが
頻繁にある、Macのminor OSアップデートで
すぐに使えなくなり、、orz…
その後Windowsの物とかも使っていたのですが
使い勝手があまり良くなくて
いつしか、あまり使わなくなっていました。。
そのため、最近は
仕方なく手入力をしてました。
今回たまたま、キャプチャ画像から
OCRできないのかな?
ということで、
調べてみると、わりと認識率がよくて
かつ環境も選ばない
WEB上のOCRが見つかり
テストしてみると、これが結構認識力がよく
さらにデジカメ画像とかでも
割と高認識するのに気がつきました。
(撮影はなるべく丁寧にしてください)
さらに、このような
WEBサービスはとても便利で
OS上の制約もなく
アプリのアップデートも関係なく
さらに、
Mac、Windows等の環境を選ばなくて
ブラウザーとネット環境さえ有れば
簡単に使用できてしまいます。
私の印象としては、このサービスは
とても便利に使えると思いますし
登録するともっと便利に使えるようです。
末永く無料で使えると、とてもいい物かもしれません。
以上です。
画像内の日本語テキストを抽出できる「Online OCR」が無料なのに便利すぎる
読めない漢字の調べ方,PCとスマホで調べる方法
関連記事です
読めない漢字の調べ方,PCとスマホで調べる方法
新記事;GoogleドキュメントでOCR、おすすめ!!
OCRとは?をわかりやすく説明しフリーアプリソフトで無料のGoogleドキュメントを使ってMacでOCRの工夫,スマホやカメラを使ったやり方やできないときの応用編と連続PDFの作成と処理の方法をまとめてみました
>スクリーンキャプチャ(ping、jpeg)にて
>ほぼ普通のテキストに変換される
>感じです。
ping –> png
でしょうか。間違っていたらすみません
ご指摘ありがとうございます。(^ ^)
明らかに間違ってますね。(苦笑)
自分では、気が付かない時があるので
こういった、ご指摘はとても助かります。
どうもありがとうございました。(^ ^;)冷汗