Cloud OCR Snipで画像ファイルから文字認識する方法を説明します!

このページではフリーソフト「Cloud OCR Snip」で画像ファイルから文字認識する方法について説明しています。

このソフトの概要についてはこちらを、インストール・初期設定方法についてはこちらをご覧ください。

また、画面上の文字を読み取る方法についてはこちらをご覧ください。

画像ファイルから文字認識する

1. タスクトレイのアイコンを右クリックする

2. 「画像ファイルから読み取る」を左クリックする

f:id:bigbamboo-jp:20211226042749p:plain

3. 文字認識する画像を選ぶ

f:id:bigbamboo-jp:20211226044754p:plain

4. 文字認識完了

f:id:bigbamboo-jp:20211226035605p:plain

クリップボード上にある画像から文字認識する

文字認識の結果と読み取った画像の両方が必要な場合は、先に切り取り & スケッチでスクリーンショットを撮影してから(ショートカットキー:Windowsキー・Shiftキー・Sキー同時押し)、その画像をCloud OCR Snipで読み込みます。

※切り取り & スケッチでショートカットキーを使用してスクリーンショットを撮影すると、自動でクリップボードにコピーされます。また、撮影完了時に表示される通知をクリックすると、スクリーンショットをファイルに保存することができます。

タスクトレイのアイコンから始める場合

1. タスクトレイのアイコンを右クリックする

2. 「クリップボードの画像から読み取る」を左クリックする

クリップボード上に読み込める画像データがない場合はクリックできません。

f:id:bigbamboo-jp:20211226050311p:plain

ショートカットキーから始める場合

1 & 2. ショートカットキーを押す

※デフォルトのショートカットキー:Windowsキー・Shiftキー・Dキー同時押し

クリップボード上に読み込める画像データがない場合は何も起きません。

共通の手順

3. 文字認識完了

f:id:bigbamboo-jp:20211226035605p:plain

※画面上の文字を読み取る方法についてはこちらをご覧ください。

Cloud OCR Snipで画面上の文字を読み取る方法を説明します!

このページではフリーソフト「Cloud OCR Snip」で画面上の文字を読み取る方法について説明しています。

このソフトの概要についてはこちらを、インストール・初期設定方法についてはこちらをご覧ください。

また、画像ファイルから文字認識する方法についてはこちらをご覧ください。

タスクトレイのアイコンから始める場合

1. タスクトレイのアイコンを左クリックする

f:id:bigbamboo-jp:20211226034116p:plain

ショートカットキーから始める場合

1. ショートカットキーを押す

※デフォルトのショートカットキー:Altキー・Shiftキー・Sキー同時押し

共通の手順

2. 文字認識させたい範囲で左クリックしながらドラッグする

エスケープキーで文字認識をキャンセルできます。

3. 範囲が決まったら左クリックをやめる

f:id:bigbamboo-jp:20211226034720p:plain

4. 文字認識完了

f:id:bigbamboo-jp:20211226035605p:plain

※画像ファイルから文字認識する方法についてはこちらをご覧ください。

Cloud OCR Snipのインストール・初期設定について説明します!

このページではフリーソフト「Cloud OCR Snip」のインストール・初期設定について説明しています。

↓のページでこのソフトの概要について説明しているので、読んでない方はぜひそちらを先にご覧ください。

bigbamboo-jp.hatenablog.com

インストールの流れ

1. 最新のインストーラーをダウンロードする

配布ページはこちらです。

f:id:bigbamboo-jp:20211227035539p:plain

2. ダウンロードしたインストーラーを実行する

f:id:bigbamboo-jp:20211227035303p:plain

※ユーザーアカウント制御の画面が表示された場合は実行を許可してください。

3. 画面の指示に従ってインストールする

初期設定の流れ

通常、インストールが完了すると自動で初期設定ウィンドウが開きますが、何らかの理由で開かなかった場合は以下の操作をしてください。

スタートメニューを開く→Cloud OCR Snip フォルダを展開する→Cloud OCR Snipを実行する

※ユーザーアカウント制御画面が出た場合は実行を許可してください。

f:id:bigbamboo-jp:20211227035040p:plain

基本的には画面の指示に従っていけば初期設定を終えることができますが、クラウドサービスの設定については少し複雑なのでここで簡単に説明したいと思います。

Google Cloud Vision APIを使う場合

このクラウドサービスは利用時に認証が必要であるため、事前にGoogleのサイトで登録を行っておく必要があります。

ここで説明しようかとも思いましたが、既にしっかり解説しているサイトがあったのでそちらをご覧ください。リンク先のページのjsonファイルをダウンロードするところまでの操作が必要です(ダウンロードしたファイルはソフトに登録してください)。

※設定する支払い方法はクレジットカード(デビット含む)、PayPalから選べます。

www.asobou.co.jp

さっそく使ってみる

初期設定が終わったら、早速使ってみましょう!

※使い方は以下のページで説明しています。

 画面上の文字を認識する方法:

https://bigbamboo-jp.hatenablog.com/entry/cos-introduction-3

 画像ファイルから文字認識する方法:

https://bigbamboo-jp.hatenablog.com/entry/cos-introduction-4

パソコンの画面や画像ファイルの文字をコピーして使いたい!

PCを使っていると、たまにこんなことがあります。

f:id:bigbamboo-jp:20211225214211p:plain

「え...なんだって?」(画像:EmEditorのメッセージダイアログ)

こんなとき、大体の人は翻訳サイトを使って意味を理解しようとします。ですが、これはメッセージダイアログです。

ドラッグして範囲選択をした後に右クリックして「コピー」をクリック...        なんてことはできません。

なので、普通は翻訳サイトに手打ちで入力することになるのですが、ある程度長いテキストになってくるともう面倒くさくて仕方ないわけです。そうなると、人間は楽したい生き物なので、「画面上の文字をパット読み取る方法はないかな~」なんて考えますよね?

今回はそれを簡単に実現するソフトをご紹介したいと思います。

フリーソフト:Cloud OCR Snip

前置きが長くなりましたが、今回紹介するのは「Cloud OCR Snip」というフリーソフトです。

画面上の文字を読み取る方法は他のブログでも紹介されていたりするのですが、大体どの方法も手順が多い認識精度が微妙などの問題を抱えています。

f:id:bigbamboo-jp:20211225211550p:plain

北海道=j七海道 では使い物にならない (画像:「日本」の検索結果をGT Textで文字認識させた結果)

上の画像のような認識結果を返すソフトはみんなローカルの文字認識エンジンを使用して文字認識をしています。確かに簡単な文であればそれできちんと読み取れるかもしれませんが、少し難しい文字が入ってきたりすると一気に精度が落ちてしまいます。

同じ文章を今度はCloud OCR Snipで文字認識させてみます。

f:id:bigbamboo-jp:20211225213445p:plain

パット見、間違いが見つからない (画像:「日本」の検索結果をCloud OCR Snipで文字認識させた結果)

こちらは一字一句しっかりと読み取れています。

ここまで差が出る理由は、画像の解像度の違いなどではなく、データをクラウドで処理している点にあります。詳しく言うと、撮影した画像をクラウドサービスに送信して、クラウドサービスで分析して返ってきた結果を表示しているためです。

ただそれだけを聞くと、「なぜ画像を処理する場所が変わっただけでこれほど差が出るの?」と疑問を抱くと思います。

それはそれぞれのクラウドサービスが独自技術で認識精度を上げているからなのですが、上の例で使ったクラウドサービスの「Google Cloud Vision API」の場合は以下のようなことを行っていると思われます。

  • 世界中の人々が行ったウェブ検索で収集したデータを分析する
  • ウェブ上の画像を収集して分析する
  • これまでに行った文字認識のデータを分析する

このような文字認識の機能はクラウドサービスによっては完全に有料だったりするんですが、Google Cloud Vision API」については毎月1000回まで無料です(1000回を超えると1000回ごとに$1.50 (約170円)かかります)。

※上記の情報は2021年12月時点のものです。最新の情報はこちらから確認してください。

また、タスクバーの右にあるアイコンをクリックするかショートカットキーを押すだけで文字認識を始められるので、ちょっと調べたいような時でも手軽に使用できます。

まとめると、Cloud OCR SnipとGoogle Cloud Vision APIを使えば(毎月1000回まで)無料かつ簡単にとても高精度な文字認識を利用できるというわけです。

使い方

細かく説明するためにページを分けました。

インストール・初期設定方法:

https://bigbamboo-jp.hatenablog.com/entry/cos-introduction-2

画面上の文字を読み取る方法:

https://bigbamboo-jp.hatenablog.com/entry/cos-introduction-3

画像ファイルから文字認識する方法:

https://bigbamboo-jp.hatenablog.com/entry/cos-introduction-4

リンク

ブログはじめました

今回ブログを始めることになりました。よろしくお願いします!

といっても、定期的に投稿する気はあんまりありません...

書くこと

主にIT系のことを書きます(どちらかというと開発側に寄った内容が多くなると思います)。また、自分は開発者なので、自作したソフトの紹介なんかもできればいいなと思っています。

記事の品質はあまり気にせず、備忘録みたいな記事も投稿していこうと思います。

投稿者について

日本 生まれ・育ち・暮らしの、ただの学生です。

著作権について

別途著作権表記をしている著作物を除いて、このブログの著作権は以下の表示の通りです。

Copyright (c) Takuma Otake