GroqとOCRの連携イメージ
How to Integrate Applications

2025-05-01

【簡単設定】GroqとOCRを連携して画像・PDFの内容を自動要約する方法

k.tsukamoto

「会議資料や契約書のPDFから必要な情報だけ抜き出して、内容を把握するのが大変…」
「画像で送られてきた請求書や領収書の情報を手入力で転記するのが面倒で、ミスも起きやすい…」

このように、画像やPDFファイルに含まれるテキスト情報の扱いに、時間や手間を取られていませんか?特に、大量の書類を確認したり、複雑な内容を理解したりする必要がある場合、その負担は大きくなりがちです。

<span class="mark-yellow">画像やPDFファイルを自動でOCR処理してテキスト化し、さらにその内容をGroqのようなAIが要約して、必要な情報を瞬時に把握したり、他のツールに連携したりできる仕組み</span>があれば、書類確認にかかる時間を大幅に短縮し、入力ミスもなくなり、よりスムーズな情報活用が可能になります。
今回ご紹介する自動化の設定は、ノーコードで簡単に設定できて、手間や時間もかからないので、ぜひ自動化を導入して作業をもっと楽にしてみてください!

とにかく早く試したい方へ

Yoomには<span class="mark-yellow">画像やPDFファイルをAIで読み取り要約する業務フロー自動化のテンプレート</span>が用意されているので、「まずは試してみたい!」という方は、以下のバナーをクリックして、すぐに自動化を体験してみましょう!

GroqとOCRで画像・PDFの内容を自動で要約・連携する方法

OCR(光学文字認識)技術とGroqのような高性能AIを組み合わせることで、画像やPDFファイル内のテキスト情報を効率的に抽出し、その内容を要約して様々なツールへ連携する自動化が可能です。
ここでは、具体的なテンプレートを紹介しながら、その活用方法を見ていきましょう!
気になる内容があれば、ぜひクリックしてみてください!

メールで要約結果を送信する

<span class="mark-yellow">OCRで読み取り、Groqで要約したファイルの内容をGmailやOutlookを使って、関係者に自動でメール送信する</span>ことができるので、重要な書類の内容を素早く関係部署や担当者に共有でき、手作業によるメール作成の手間と送信漏れのリスクをなくし、効率的な情報伝達を可能にします!

チャットツールに要約結果を通知する

<span class="mark-yellow">画像やPDFの内容をOCRで読み取り、Groqで要約した結果をSlackやGoogle Chatなどのビジネスチャットツールに自動で通知する</span>ことができるので、チームメンバーとの情報共有が迅速かつ簡単になり、確認漏れや連携ミスを防ぎ、スムーズなコミュニケーションを実現します!

データベースに要約結果を記録する

<span class="mark-yellow">OCRで読み取ったテキストとGroqによる要約結果を、Google スプレッドシートやNotionなどのデータベースに自動で記録・蓄積する</span>ことができるので、書類情報を一元管理し、後からの検索や分析が容易になり、手作業でのデータ入力の手間と入力ミスを削減し、ナレッジの蓄積と活用を促進します!

Google Drive上のファイルをOCRで読み取り、Groqで要約してGmailで送信するフローを作ってみよう

それではここから代表的な例として、Google Driveに特定のファイルが格納された際に、そのファイルをOCRで読み取り、内容をGroqで要約してGmailで自動送信するフローを解説していきます!

まだYoomのアカウントをお持ちでない場合は、こちらの登録フォームからアカウントを発行しておきましょう。

[Yoomとは]

フローの作成方法

今回は大きく分けて以下のプロセスで作成します。

  • 使用するアプリのマイアプリ連携
  • テンプレートのコピー
  • トリガーとなるフォルダと各アクション(OCR・要約・メール送信)の設定
  • フロー稼働の準備

前準備:テキスト抽出するファイルの用意

テスト用にPDFファイルか画像ファイルをご用意ください。
OCRで対象テキストを抽出し、Groqで要約を行うため、契約書や議事録などの長文が記載されたファイルが適しています。
ここでは例として、下図のような議事録を使用します。

ステップ1:使用するアプリのマイアプリ連携

先ずは、Yoomと連携させたいアプリ(Groq・Google Drive・Gmail)を「マイアプリ」に登録しましょう。
この設定は初回のみ必要です。

  1. Yoomにログイン後、ワークスペースのサイドバーから「マイアプリ」を選択。
  2. マイアプリ画面の右側にある「+新規接続」をクリック。
  1. 「アプリ一覧」が表示されたら、右上の検索バーでアプリ名(ここではGroq)を検索して選択。
  1. 「アカウント名」に任意の名称を設定。
  2. 「API Key」を取得するため、Groq Cloudに任意のアカウントでログイン。
  3. 「API Keys」にアクセスし、「Create API Key」をクリック。
  1. キーの名称を設定し、「Submit」をクリック。
  1. APIキーが発行されるため、「Copy」をクリック。
    この画面を閉じると、以降はAPIキーを確認できなくなるため、取得したAPIキーは安全な場所に保管してください。
  1. Yoomのアプリ連携画面に戻り、取得したAPIキーを「アクセストークン」に設定。
  2. 設定を終えたら「追加」をクリック。
  1. 「マイアプリ」の画面に戻り、Groqが追加されていることを確認してください。
  2. 同様に、Google Driveの連携も行いましょう。
    「アプリ一覧」でGoogle Driveを検索して選択。
  3. 「Sign in with Google」をクリック。
  1. 任意のGoogleアカウントを選択してログイン。
  1. 内容を確認し、「次へ」をクリック。
  1. YoomからGoogleアカウントへのアクセス権限を確認し、「続行」をクリック。
    「Yoomがアクセスできる情報を選択してください」と表示されている場合には、「すべて選択」にチェックを入れてください。
  1. 「マイアプリ」の画面に戻り、Google Driveが追加されていることを確認してください。
  2. 最後に、Gmailを連携します。Gmailの連携方法はGoogle Driveと変わりません。
    「Sign in with Google」をクリックし、任意のGoogleアカウントでログインした後、YoomからGoogleアカウントへのアクセス権限を許可します。

使用する3つのアプリがマイアプリに追加されたら、マイアプリ連携は完了です。

ステップ2:テンプレートのコピー

Yoomのフローボットテンプレートから使用するテンプレートを選び、「このテンプレートを試す」をクリックすると、テンプレートがコピーされます。
ここでは以下のテンプレートを使うため、バナーの「試してみる」をクリックしてください。

そうしますと、Yoomのワークスペースにテンプレートがコピーされ、自動化フローの設定画面(フローボット)が開きます。
「OK」をクリックして、フローの設定に進みましょう。

ステップ3:トリガーとなるフォルダの設定

先ずは、フローの起点となるトリガーアクションを設定していきます。

  1. Google Driveの「特定のフォルダ内に新しくファイル・フォルダが作成されたら」をクリック。
  1. 連携アカウントとアクションの内容を確認し、「次へ」をクリック。
    ※ 「タイトル」は任意の名称に変更可能です。アクションの内容が分かりやすいタイトルにするとよいでしょう。
    ここでは例として、「連携用フォルダに議事録が追加されたら」に変更しています。
  1. 「トリガーの起動間隔」のプルダウンから任意の間隔を選択。
    トリガーの起動タイミングは「5分・10分・15分・30分・60分」から選択可能です。
    そのプランの最短の起動間隔にすることで、新しいファイルの追加に対して、より早くメール通知が行えるようになります。
    ※ ご利用プランによって、設定できるトリガーの最短間隔が違うのでご注意ください。
  1. 「フォルダID」にトリガーとなるフォルダのドライブのIDを設定。
    入力欄をクリックすると、連携しているGoogle Driveアカウントからフォルダの候補が表示されますので、対象となるフォルダを選択してください。
    検索欄にフォルダ名を入れると検索が楽になります。
    ここでは例として、「連携用フォルダ」を設定しています。
  1. 設定を終えたら、前準備で用意したファイルを対象となるフォルダに追加し、「テスト」をクリック。
  1. テストに成功すると、「取得した値」の各項目に最終更新日時が最も新しいファイル1件の情報が追加されます。
  1. テスト用に追加したファイルであることを確認し、ページ下部の「保存する」をクリック。

これで、対象フォルダに新しく作成されたファイルの情報が取得できました。
※ アクションのタイトルが変更され、チェックマークがついています。

ステップ4:ファイルのダウンロード

ステップ3で取得したファイル情報を用いて、Google Driveからファイルをダウンロードしましょう。

  1. Google Driveの「ファイルをダウンロードする」をクリック。
  1. 連携アカウントとアクションの内容を確認し、「次へ」をクリック。
  1. 「ファイルID」にはデフォルトで、ステップ3で取得したファイルのIDが設定されています。
  2. 変更は行わず、「テスト」をクリック。
  1. テストに成功すると、対象のファイルがダウンロードされます。
    この時、ダウンロードされたファイルの名前は「Untitled」で固定されるため、正しいファイルであるかを確認する場合は「ダウンロード」をお試しください。
  1. ページ下部の「保存する」をクリック。

これで、ファイルのダウンロードは完了です。

ステップ5:テキストの抽出

ダウンロードしたファイルからテキストを抽出しましょう。
※ OCRや音声を文字起こしするAIオペレーションは、チームプラン・サクセスプラン限定の機能です。
フリープランやミニプランでセットするとエラーになってしまうので、ご注意ください。
※ チームプランやサクセスプランなどの有料プランは、2週間の無料トライアルが可能です。
トライアル期間中は、通常だと制限があるアプリやAIオペレーションもすべて使えるので、気になる機能をぜひお試しください。

  1. AIオペレーションの「画像・PDFから文字を読み取る」をクリック。
  1. 目的に応じて「アクション」を選択。
    このフローで使用する「任意のPDF・画像ファイルから文字情報を読み取る」は文字数によってタスク数が変わります。
    4,000字(5タスク)・8,000字(10タスク)・12,000字(15タスク)から任意のアクションを選択してください。デフォルトでは4,000字となっています。
    ※ YoomのOCR機能では、アクション記載の規定の文字数を超えるデータや、文字が小さすぎる場合に正しく読み取れないことがあります。
    文字数や文字の大きさには少し余裕を持たせてご利用ください。
  1. 「次へ」をクリック。
  2. OCRの対象となるファイルを設定する「ファイルの添付方法」には、デフォルトで「GoogleDriveからの取得ファイル」が設定されています。
    これがステップ4で取得したファイルになりますので、変更は必要ありません。
  3. 「抽出したい項目」に、目的に応じて任意の項目を設定。
    この抽出する項目に沿った値が次のステップで利用できます。
    設定例にあるように「会議名・日時参加者・主要議題」などを指定すると、ファイル内の特定のテキストだけが抽出されます。
    この指定方法は議事録や報告書といった定型項目のあるファイルに有効です。
    そうでない場合には、「全文」と指定することでファイルのテキストを全て抽出できます。
  4. 「使用するAI」を「ChatGPT」「Claude」「Claude_v2(推奨)」から選択。
    AIモデルの違いはこちらのヘルプページで説明されています。
  5. 「言語」を「日本語」「英語」から選択。
  6. OCRの詳しい設定方法は、こちらのヘルプページをご覧ください。
    設定を終えたら、「テスト」をクリック。
    ここでは例として、「会議名,日時,参加者,主要議題,決定事項,次回会議」をダウンロードしたファイルから抽出します。
  1. テストに成功すると、「抽出したい項目」に設定した項目の値がファイルから抽出され、「取得した値」に追加されます。
    ※ 期待する値が抽出されていない場合には、「使用するAI」を変更して再度お試しください。
  1. 抽出したい情報が取得されていることを確認し、ページ下部の「保存する」をクリック。

これで、ファイルからテキストが抽出できました。

ステップ6:テキストの要約

ステップ5で抽出したテキストをGroqで要約していきます。

  1. Groqの「テキストを生成」をクリック。
  1. 連携アカウントとアクションの内容を確認し、「次へ」をクリック。
  1. 「モデルID」の入力欄をクリックし、表示される候補から要約に使用するモデルを選択。
    GroqCloudドキュメントのSupported Modelsも合わせてご参照ください。
    ここでは「llama-3.3-70b-versatile」を選択しています。
  1. 要約にあたっての「ロール」を「User」「System」「Assistant」から選択。
    ここでは「User」を選択しています。
  2. 「メッセージ」にステップ5で抽出したテキストと、要約にあたってのプロンプトを設定。
    入力欄をクリックすると、各アクションで取得した値が表示されます。
    アクションメニューを開いて項目を選択すると{{項目名 取得した値}}の形で、入力欄に追加されます。
  1. その他、「最大トークン数」や「応答フォーマット」など、必要に応じて各種設定が可能です。
  2. 設定を終えたら、「テスト」をクリック。
  3. テストが成功すると、要約されたテキストが「取得した値」の「メッセージ内容のリスト」に追加されます。
  1. 期待する要約が取得できているかを確認し、ページ下部の「保存する」をクリック。

これで、テキストが要約されました。

ステップ7:Gmailの送信

最後に、要約したテキストをGmailで通知しましょう。

  1. Gmailの「メールを送る」をクリック。
  1. メール内容の「From」を設定。
    入力欄をクリックすると、連携しているGoogleアカウントのメールアドレスが候補として表示されます。
  2. 「To」に要約の宛先を設定。
  3. 「CC」「BCC」や「差出人の名前」は必要に応じて設定してください。
  1. 「件名」と「本文」に任意の通知内容を設定。
    ステップ6と同様に、入力欄クリック時に表示される「取得した値」タブから、各アクションで取得した値が選択可能です。
    これらの値を用いて、通知するメッセージを作成しましょう。
    「日付」タブから任意の日付を追加することもできます。
  1. 設定を終えたら、ページ下部の「次へ」をクリック。
  2. メールの送信内容を確認し、「テスト」をクリック。
  1. 「テスト成功」の結果が表示されたら、指定した宛先にメールが送信されていることを確認し、ページ下部の「保存する」をクリックしてください。
    ※ 宛先が受信したメール

ステップ8:フロー稼働の準備(トリガーをONに設定)

フロー画面に戻り、「全ての設定が完了しました!」と表示されていればフローの設定は完了です。
早速フローを稼働させるのであれば、「トリガーをON」をクリックします。

あとで稼働させる場合は、フロー画面のトリガースイッチをクリックすることで、トリガーをONにできます。

トリガーをONにしたら、実際に動作することを確認しましょう。
ステップ3で指定したフォルダにファイルを作成し、要約されたメッセージがメールで通知されていれば成功です。

OCRを使ったその他の自動化例

OCRを活用することで、様々な自動化の実現が可能になります。

OCRを使った自動化例

契約書や名刺、フォーム添付ファイルなどをOCRで読み取り、Microsoft TeamsやGoogle スプレッドシート、Airtable、Google ドキュメント、Microsoft Excelなどに自動で情報を連携することができます。ファイルのアップロードや契約完了をトリガーに、手作業なしで情報整理が可能です。

まとめ

この記事では、「GroqとOCRを連携して画像・PDFの内容を自動要約する方法」について、プログラミング不要で実現できる具体的な手順をご紹介しました。OCRで画像やPDFファイル内の文字を正確に読み取り、Groqを使って要点を自動で要約することで、情報整理や共有にかかる手間を大幅に削減できます。

<span class="mark-yellow">Yoomには、今回ご紹介した要約の自動化以外にも、業務を効率化するためのテンプレートが豊富に揃っています。</span>
ファイルのアップロードをトリガーにした通知や記録、定期的なレポート作成など、さまざまなフローをすぐに構築できるのが魅力です。

「資料を読む時間が取れない」「チームへの情報共有が遅れてしまう」「要約や転記に手間がかかる」といった課題を感じている方は、ぜひYoomのテンプレートを活用して自動化を始めてみてください。誰でも簡単に設定できて、業務の負担を確実に軽減できますよ!

まずはテンプレートを試して、便利さを体感してみませんか?
👉 今すぐ無料でアカウントを発行する

The person who wrote this article
k.tsukamoto
Worked as a system engineer for 4 years. At that time, I was bothered by attendance management that was manually entered into Excel every day and the work of converting receipts into data, so I wanted to meet Yoom even faster. I've just started using Yoom, but I'm going to share information to make everyone's “it would be nice if it could be automated” come true!
Tags
No items found.
Related Apps
App integration
No items found.
What is Yoom hyperautomation?
Conventional RPA can only automate simple repetitive tasks, and the setup process was very complicated.
With “hyperautomation,” which combines various technologies such as AI, API, RPA, and OCR, it is possible to automate many tasks that could not be realized until now more easily than before.
Don't Just Connect Apps—Automate Everything
Most tools simply connect one app to another, leaving the complex tasks to you. Yoom goes much further: From document creation and browser automation to OCR and generative AI, Yoom handles it all seamlessly in one platform.

Why settle for basic integrations? Streamline your entire workflow with Yoom’s powerful hyperautomation.
Learn more about Yoom
RELATED ARTICLES
No items found.
Helpful Materials
I understand Yoom! 3-piece set of materials
Download materials
Understand in 3 minutes! Yoom service introduction materials
Download materials
Find out by Before After! Yoom Case Study Collection
Download materials
See a list of useful materials