Google スプレッドシートとOCRの連携イメージ
アプリ同士の連携方法

2025-05-02

【簡単設定】本のPDFデータをOCRして活用する方法

k.tsukamoto

「紙の本の内容をデータ化したいけど、手入力は時間がかかりすぎる…」
「スキャンした本のPDFからテキストを抽出して、効率的に情報を整理・活用したい!」
このように、書籍の情報をデジタルデータとして扱いたいものの、その手間や方法に悩んでいませんか?

<span class="mark-yellow">メールで受け取った書籍のPDFや、スキャンして保存した本の画像ファイルを自動でOCR処理し、テキストデータをツールに整理・記録できる仕組み</span>があれば、面倒な手作業から解放され、書籍から得た知識や情報をより効果的に活用できるようになります!

今回ご紹介する自動化の設定は、ノーコードで簡単に設定できて、手間や時間もかからないので、ぜひ自動化を導入して書籍情報の活用をもっと楽にしましょう!

とにかく早く試したい方へ

Yoomには<span class="mark-yellow">本のPDFデータをOCRする業務フロー自動化のテンプレート</span>が用意されているので、「まずは試してみたい!」という方は、以下のバナーをクリックして、すぐに自動化を体験してみましょう!

本のPDFデータをOCRして自動記録する方法

普段お使いの様々なツールを起点として、書籍などのPDFデータをOCR処理し、その結果をツールに自動で記録する方法を紹介します!
なお、今回はデータの記録先に、例としてGoogle スプレッドシートを選択しました!もちろんその他のツールに記録、送信することも可能です。

自動化を簡単に設定できるテンプレートをいくつか用意したので、気になるものがあったらクリックではじめてくださいね!

メールで受信した書類をOCRする

GmailやOutlookなどのメールツールで受信しメールに添付された領収書や<span class="mark-yellow">書籍のPDFデータなどを自動でOCRし、Google スプレッドシートに記録する</span>ことで、メールからの転記作業の手間を大幅に削減できます。

フォームで受け付けた書類をOCRする

GoogleフォームやYoomの入力フォームなどで受け付けたファイル(領収書や<span class="mark-yellow">書籍データなど)を自動でOCR処理し、Google スプレッドシートに整理・記録する</span>ことで、フォームからのデータ入力と管理を効率化します。

ストレージ上の書類をOCRする

Google DriveやOneDriveなどのストレージサービスに保存された領収書や<span class="mark-yellow">書籍のPDFファイルを自動でOCRし、抽出したテキストデータをGoogle スプレッドシートに転記する</span>ことで、ファイル管理とデータ活用の連携をスムーズにします。

Gmailに添付された本のPDFをOCRしてGoogle スプレッドシートに記録するフローを作ってみよう

それでは、代表的な例として「Gmailに添付された本のPDFデータをOCR処理し、抽出したテキスト情報をGoogle スプレッドシートに自動で追加するフロー」を解説していきます!

ここではYoomを使用してノーコードで設定をしていくので、まだYoomのアカウントをお持ちでない場合は、こちらの登録フォームからアカウントを発行しておきましょう。

[Yoomとは]

フローの作成方法

今回は大きく分けて以下のプロセスで作成します。

  • GmailとGoogle スプレッドシートのマイアプリ連携
  • テンプレートのコピー
  • トリガーとなるメールと各アクション(OCRとレコード追加)の設定
  • フロー稼働の準備

前準備:テストに使用するファイルの用意

テスト用に、レコードに追加したい本のPDFファイル(もしくは画像ファイル)と、抽出した本データを追加するGoogle スプレッドシートのファイルをご用意ください。
ここでは例として、下図のPDFファイルと本データ管理シートを使用します。

※ OCRのアクションには文字数・ページ数の上限があります。
対象となる本のPDF・画像ファイルは12,000字(且つAIモデルの「Claude」を使う場合は20ページ以内)に収まるように編集してください。

ステップ1:GmailとGoogle スプレッドシートのマイアプリ連携

先ずは、GmailとGoogle スプレッドシートのアカウントを「マイアプリ」に登録しましょう。
この設定は初回のみ必要です。

  1. Yoomにログイン後、ワークスペースのサイドバーから「マイアプリ」を選択。
  1. マイアプリ画面の右側にある「+新規接続」をクリック。
  2. 「アプリ一覧」が表示されたら、右上の検索バーでアプリ名(ここではGmail)を検索して選択。
  1. 「Sign in with Google」をクリック。
  1. 任意のGoogleアカウントを選択してログイン。
  1. 内容を確認し、「次へ」をクリック。
  1. YoomからGoogleアカウントへのアクセス権限を確認し、「続行」をクリック。
    「Yoomがアクセスできる情報を選択してください」と表示されている場合には、「すべて選択」にチェックを入れてください。
  1. 「マイアプリ」の画面に戻り、Gmailが追加されていることを確認してください。
  1. 同様の手順で、Google スプレッドシートも連携しましょう。
    「Sign in with Google」をクリックし、任意のGoogleアカウントでログインした後、YoomからGoogleアカウントへのアクセス権限を許可します。
  2. Google スプレッドシートもマイアプリに追加されたら、マイアプリ連携は完了です。

ステップ2:テンプレートのコピー

Yoomのフローボットテンプレートから使用するテンプレートを選び、「このテンプレートを試す」をクリックすると、テンプレートがコピーされます。
ここでは以下のテンプレートを使うため、バナーの「試してみる」をクリックしてください。

そうしますと、Yoomのワークスペースにテンプレートがコピーされ、自動化フローの設定画面(フローボット)が開きます。
「OK」をクリックして、フローの設定に進みましょう。

ステップ3:トリガーとなるメールの設定

先ずは、フローの起点となるトリガーアクション(メールの受信)を設定していきます。

  1. Gmailの「特定のキーワードに一致するメールを受信したら」をクリック。
  1. 連携アカウントとアクションの内容を確認し、「次へ」をクリック。
    ※ 「タイトル」は任意の名称に変更可能です。アクションの内容が分かりやすいタイトルにするとよいでしょう。
    ここでは例として「「本データ」を含むメールを受信したら」に変更しています。
  1. 「トリガーの起動間隔」のプルダウンから任意の間隔を選択。
    トリガーの起動タイミングは「5分・10分・15分・30分・60分」から選択可能です。
    そのプランの最短の起動間隔にすることで、メール受信時により早くレコードの追加が行えるようになります。
    ※ ご利用プランによって、設定できるトリガーの最短間隔が違うのでご注意ください。
    起動間隔についての詳しい説明は、こちらのヘルプページをご覧ください。
  1. 「キーワード」にトリガーとなるメールに含まれるキーワードを設定。
    ここでは例として、キーワードに「本データ」と設定します。
  1. テスト用に、前準備で用意したPDFファイルを添付したメールを、連携しているGmailアカウントに送信します。
    ※ 送信したメール
  1. フローボットに戻り、「テスト」をクリック。
    ※ 直近1時間以内にキーワードを含むメールを受信していない場合はテストに失敗します。
  1. テストに成功すると、「取得した値」に受信したメールの情報が追加されます。
    これらの値は、以降のアクションで変数として使用できるようになります。
    取得した値(アウトプット)についての詳しい説明は、こちらのヘルプページをご覧ください。
  1. 取得したメール情報に問題がなければ、ページ下部の「保存する」をクリック。

これで、トリガーとなるメールの設定が完了しました。

ステップ4:テキストの抽出

OCRを使って、受信したメールの添付ファイルから本データを抽出しましょう。
※ OCRや音声を文字起こしするAIオペレーションは、チームプラン・サクセスプラン限定の機能です。
フリープランやミニプランでセットするとエラーになってしまうので、ご注意ください。
※ チームプランやサクセスプランなどの有料プランは、2週間の無料トライアルが可能です。
トライアル期間中は、通常だと制限があるアプリやAIオペレーションもすべて使えるので、気になる機能をぜひお試しください。

  1. AIオペレーションの「画像・PDFから文字を読み取る」をクリック。
  1. 目的に応じて「アクション」を選択。
    このフローで使用する「任意のPDF・画像ファイルから文字情報を読み取る」は文字数によってタスク数が変わります。
    4,000字(5タスク)・8,000字(10タスク)・12,000字(15タスク)から任意のアクションを選択してください。デフォルトでは最大文字数の12,000字となっています。
    ※ YoomのOCR機能では、アクション記載の規定の文字数を超えるデータや、文字が小さすぎる場合に正しく読み取れないことがあります。
    文字数や文字の大きさには少し余裕を持たせてご利用ください。
  1. 「次へ」をクリック。
  2. OCRの対象となるファイルを設定する「ファイルの添付方法」には、デフォルトで「取得した値を使用」「添付ファイル1」が設定されています。
    これがステップ3で取得した添付ファイルになりますので、変更は必要ありません。
  3. 「抽出したい項目」に、目的に応じて任意の項目を設定。
    抽出する項目を、前準備で用意したGoogle スプレッドシートの列項目に合わせることで、次のステップでのレコード追加がしやすくなります。
    「著者」のようにファイル内に記載のあるテキストをそのまま抜き出すだけでなく、「概要」や「ジャンル」といった項目も、AIが自動で要約や判別を行います。
  4. 「使用するAI」を「ChatGPT」「Claude」「Claude_v2(推奨)」から選択。
    AIモデルの違いはこちらのヘルプページで説明されています。
  5. 「言語」を、読み取るファイルの言語に合わせて「日本語」「英語」から選択。
  6. OCRの詳しい設定方法は、こちらのヘルプページをご覧ください。
    設定を終えたら、「テスト」をクリック。
    ここでは例として、Google スプレッドシートの列項目である「タイトル,著者,概要,ジャンル」を添付ファイルから抽出します。
  1. テストに成功すると、「抽出したい項目」に設定した項目の値がファイルから抽出され、「取得した値」に追加されます。
    ※ 期待する値が抽出されていない場合には、「使用するAI」を変更して再度お試しください。
  1. 抽出したい情報が取得されていることを確認し、ページ下部の「保存する」をクリック。

これで、添付ファイルから本データが抽出できました。

ステップ5:Google スプレッドシートへの追加

最後に、抽出した本データをGoogle スプレッドシートに追加しましょう。

  1. Google スプレッドシートの「レコードを追加する」をクリック。
  1. 連携アカウントとアクションの内容を確認。
  2. データベースの連携の「スプレッドシートID」に、抽出したデータを追加したいスプレッドシートのIDを設定。
    入力欄をクリックすると、連携しているGoogleアカウントからスプレッドシートの候補が表示されます。
    前準備で用意したスプレッドシートを選択してください。
    検索欄にスプレッドシート名を入れると検索が楽になります。
  1. 「スプレッドシートのタブ名」に対象となるスプレッドシートのタブ(シート)名を設定。
    入力欄クリック時に「スプレッドシートID」に設定したスプレッドシートのタブが候補として表示されるため、対象となるタブを選択してください。
  1. 「テーブル範囲」に対象となるテーブルの範囲を設定。
    例として、「本データ管理シート」の場合はA1からD1までが列になっているため、「A1:D」と入力します。
    テーブル範囲の指定に関しては以下のヘルプページもご参照ください。
  1. 設定を終えたら、「次へ」をクリック。
  1. 追加するレコードを設定していきます。
    ※ 追加するレコードの項目は指定したテーブルの列名となっています。
    入力欄をクリック後、「画像・PDFから文字を読み取る」のメニューを開くと、ステップ4で抽出した項目が表示されますので、各列に合う項目を選択してください。
    選択すると、{{項目名 抽出された情報}}のような形で入力されます。

    「日付」タブから、日付情報を設定することも可能です。

  1. 設定を終えたら、「テスト」をクリック。
  1. 「テスト成功」の結果が表示されたら、指定した通りGoogleスプレッドシートにレコードが追加されていることを確認し、「保存する」をクリックしてください。
    ※ スプレッドシートに追加されたレコード

ステップ6:フロー稼働の準備

フロー画面に戻り、「全ての設定が完了しました!」と表示されていればフローの設定は完了です。
早速フローを稼働させるのであれば、「トリガーをON」をクリックします。

あとで稼働させる場合は、フロー画面のトリガースイッチをクリックすることで、トリガーをONにできます。

トリガーをONにしたら、実際に動作することを確認しましょう。
ステップ3で指定したキーワードを含むメールを送信し、メールに添付されたファイルから抽出された本データがGoogle スプレッドシートのレコードとして追加されていれば成功です。

今回のフローボットをベースに、他にも様々な作業の自動化が実現できます!
是非、Yoomの便利な機能をお試しください。

OCRを使った便利な自動化例

OCRを活用すれば様々な自動化の実現が可能です!
Yoomにはまだたくさんの業務自動化例がありますが、例えば以下のような自動化はいかがでしょうか。

まとめ

書籍のPDFデータをOCR処理し自動で記録する仕組みを導入することで、<span class="mark-yellow">これまで手作業で行っていたテキストの抽出や転記作業から解放され、情報の整理と活用が格段に効率化されます。</span>
これにより、書籍から得た知識を検索可能なデータベースとして蓄積したり、引用や分析に利用したりすることが容易になり、知的生産性を高めることができます!

今回ご紹介したような業務自動化を実現できるノーコードツール「Yoom」を使えば、プログラミングの知識がない方でも、直感的な操作で簡単に業務フローを構築できます。
もし自動化に少しでも興味を持っていただけたなら、ぜひこちらから無料登録して、Yoomによる業務効率化を体験してみてください!

この記事を書いた人
k.tsukamoto
システムエンジニアとして4年間勤務。当時は毎日Excelに手入力する勤怠管理や、領収書のデータ化作業に悩まされていたため、Yoomにもっと早く出会いたかったです。まだまだYoomは使い始めたばかりですが、皆様の「自動化できたらいいな」を叶えるための情報をお伝えしていきます!
タグ
OCR
自動化
自動
連携
関連アプリ
アプリ連携
No items found.
Yoomのハイパーオートメーションとは?
従来のRPAでは単純な繰り返し作業しか自動化できず、その設定作業はとても複雑なものでした。
AI・API・RPA・OCRなど様々な技術を組み合わせた「ハイパーオートメーション」なら、これまでは実現できなかった多くの作業を、これまでよりも簡単に自動化することが可能です。
Yoomのハイパーオートメーションとは?
従来のRPAでは単純な繰り返し作業しか自動化できず、その設定作業はとても複雑なものでした。
AI・API・RPA・OCRなど様々な技術を組み合わせた「ハイパーオートメーション」なら、これまでは実現できなかった多くの作業を、これまでよりも簡単に自動化することが可能です。
Yoomについて詳しく見る
お役立ち資料
Yoomがわかる!資料3点セット
資料ダウンロード
3分でわかる!Yoomサービス紹介資料
資料ダウンロード
Before Afterでわかる!Yoom導入事例集
資料ダウンロード
お役立ち資料一覧を見る