Web制作をする際に、「テキストデータが見つからなくて、パンフレットから書き起こしてもらえないですか?」ということで、パンフレットなどの紙媒体から文字起こしをすることが結構あります。 数行でしたら問題ないのですが、数ページになればなかなかの作業量になってきます。 そこで今回は、「Googleドライブ」を利用して、画像ファイルからの文字起こし(OCR)の方法をご紹介します。 ファイル形式は、.JPEG、.PNG、GIF、PDF(複数ページのドキュメント)です。 ファイルサイズは、2 MB 以下にします。 スキャンでOKですが、今回はスマートフォンで撮影した画像を使用しました。 ※かなり暗めになりましたが問題ないです。 Googleへログインして、メニューからGoogleドライブへアクセスします。 文字起こしをするファイルをマイドライブへアップロードします。 ドラッグ&ドロップでOKです。 アップロードしたファイルを右クリックして「アプリで開く」から「Googleドキュメント」を選択します。 別タブで「Googleドキュメント」が開きます。 ※読み込みに少し時間がかかるので、「about:blank」と表示されますが少し待つと開きます。 アップロードした画像の下にテキストが表示されています。 今回の画像はテキストが少ないのですが、もっと文字数の多い画像でも同じような精度で文字起こしができました。 もちろん最終チェックは必要ですが、一から手作業で打ち込むことを考えれば圧倒的に早いです。 実際に使ってみて、修正をするのは以下のような場合です。 ・不要なスペースが入っている ・改行がされていない ・カッコが消えている ・漢字がおかしな漢字に変換されている Googleドライブのヘルプページに注意事項があるのでご一読ください。 ちなみに、公式では正しい向きでアップロードするようにと注意書きがありますが、横向きの画像や縦書きの画像でも試してみたらちゃんと書き起こしてくれました。さすがです。できるだけ鮮明な画像を用意して、Googleドライブへアップロードする。
アップロードしたファイルをGoogleドキュメントで開く
画像ファイルから文字起こしができました!
PDF や写真のファイルをテキストに変換する私達は京都でNo1のデザイン力・UI力を目指す
システム開発・Web開発カンパニー
株式会社なないろです。
各種CMS、企業サイト、キャンペーンサイト、顧客管理システム、IoTシステムなど幅広いITソリューションを優良なデザインとUIで、SEOソリューションをあわせてお客様の目標達成を行う企業です。
Laboratory
なないろ研究所
⼈と⼈をつなぐコミュニケーションをもっと世の中に。
それが私達が⾏うこと。
なないろ研究所では日々、様々なことをリサーチし、実験しています。
コミュニケーションの流通をお手伝いするために、日々様々なリサーチを行い、分析し、時に実験しております。
そんな日々の活動内容においてログをつけております。
このような情報共有が、我々が考えるコミュニケーションの一つの形です。
2018.11.23