GeminiとOCRの連携イメージ
アプリ同士の連携方法

2025-05-09

【ノーコードで実現】OCRで読み取ったファイルの情報をGeminiで自動要約する方法

n.fukuoka

「このファイル、誰が確認するんだっけ?」
「内容を確認して要約して、関係者に送るだけで半日終わってしまう…」

画像やPDFで送られてくる資料や会議後に共有されるホワイトボードの写真、現場から届く手書きメモなど内容を確認して整理して、社内の関係者に共有する作業は思った以上に時間と手間がかかりますよね。そんな日々の非効率を解消するのが、OCRとGeminiを活用したファイル情報の自動処理です。たとえば、営業資料の確認結果を自動で共有する作業や、アップロードされた見積書を要約して記録するといった作業が、人の手を介さず自動で進めることができるようになります。

本記事では、ストレージサービスに格納されたファイルをOCRで読み取りGeminiで要約して、その情報をGmailで自動送信する方法や、SlackやDiscordなどのチャットツールに自動通知する方法について画像付きで詳しく解説していきます。煩雑なファイル整理に悩まされている方は要チェックです!

とにかく早く試したい方へ

Yoomには「Google DriveのファイルをOCRで読み取り、Geminiで要約し、Gmailで送信する」自動化のテンプレートが用意されています。
「まずは試してみたい!」という方は、以下のバナーをクリックして、すぐに自動化を体験してみましょう!

ファイルからOCRで読み取り、共有する自動化例

GeminiのOCR機能を活用し、画像やPDFファイルから抽出した文字情報を様々なツールへ連携・活用する自動化テンプレートを紹介します!
気になる内容があれば、ぜひクリックしてみてください!

抽出・要約した情報をメールで送信する

ストレージサービスに格納されたファイルをOCRで読み取り、Geminiで要約した結果をGmailやOutlookといったメールツールで自動送信します。
ファイルの内容確認や報告の手間が省け、関係者への情報共有をスムーズに行えます!

 抽出した情報をチャットツールに通知する 

ストレージサービスにアップロードされた画像ファイルをGeminiが解析し、その内容をSlackやDiscordなどのチャットツールへ自動で通知します。
画像の内容確認や情報共有の手間を削減し、迅速なコミュニケーションを実現しましょう!

抽出・要約した情報をデータベース/CRMサービスに記録する

ストレージサービスにあるファイルをOCRで読み取り、Geminiで要約した内容をGoogle スプレッドシートやNotionのようなデータベース/CRMサービスに自動で追加・記録します。
手作業でのデータ入力や転記ミスを防ぎ、効率的な情報管理体制を構築できます!

Google Driveのファイルを要約してGmailで送るフローを作ってみよう

それではここから代表的な例として、Google Driveに特定のファイルが格納された際に、そのファイルをOCRで読み取り、Geminiで内容を要約してGmailで自動送信するフローを解説していきます!
今回はYoomを使用してノーコードで設定を進めていきますので、もしまだYoomのアカウントをお持ちでない場合は、こちらの登録フォームからアカウントを発行しておきましょう。

[Yoomとは]

フローの作成方法

作成の流れは大きく分けて以下です。

  • Google Drive・Gemini・Gmailのマイアプリ連携
  • テンプレートをコピーする
  • Google Driveのトリガー設定とOCR、Gemini、Gmailのアクション設定
  • トリガーをONに設定しフロー稼働の準備完了

ステップ1: Google Drive・Gemini・Gmailのマイアプリ連携

まず、Yoomのアカウントにログインします。
まだYoomを利用したことがない方は、初めてのYoomをぜひご覧ください。

1.マイアプリをクリックした後、新規接続をクリックします。

2.入力欄からアプリ名で検索できます。

Google Driveのマイアプリ登録

では、さっそくGoogle Driveからマイアプリ登録していきましょう!
入力欄にGoogle Driveと入力するとGoogle Driveのアイコンが表示されるので、アイコンをクリックします。

1.以下の画面が出てきます。
「Sign in with Google」をクリックしてください。

2.連携したいアカウントを選択しましょう。

3.以下の画面が表示されます。
「次へ」をクリックしてください。
その後、アクセスを求められるので、内容を確認した後「続行」をクリックしてください。

Geminiのマイアプリ登録

Geminiも同じように検索して、アイコンをクリックします。

1.以下の画面が出てきます。
アカウント名には使いやすい名前を自由に入力しましょう。
アクセストークンこちらから取得できます。

Gmailのマイアプリ登録

最後に、Gmailを検索しましょう!

1.以下の画面が表示されます。
「Sign in with Google」をクリックしましょう。
そこから先は、先ほどマイアプリ登録したGoogle Driveと進め方は同じです。

マイアプリ登録が成功すると、以下の画面が表示されます。
マイアプリの画面に Google Drive・Gemini・Gmailのアイコンが表示されているか確認してください。

ステップ2:テンプレートをコピー

以下のリンクから「試してみる」をクリックしてください。

以下の表示が出たら、テンプレートのコピーが成功です。
コピーしたテンプレートはマイプロジェクトに格納されます

ステップ3:特定のフォルダ内に新しくファイル・フォルダが作成されたら起動するトリガーの設定

まず、一番上の「特定のフォルダ内に新しくファイル・フォルダが作成されたら」のアイコンをクリックします。

Google Driveと連携するアカウント情報はプルダウンから選択します。
トリガーには「特定のフォルダ内に新しくファイル・フォルダが作成されたら」を選びましょう。
入力が終わったら、「次へ」を押して進めてください。

各項目を設定していきます。

  • トリガーの起動間隔:5分、10分、15分、30分、60分の間隔で起動間隔を選択できます。
    プランによって設定できる最短の間隔が異なるので、事前に確認してくださいね!
  • フォルダID:入力欄をクリックすると候補が表示されるので、その中から選択しましょう。

設定が終わったらテストのため、Google Driveの画面でファイルをアップロードしてください。
なお、今回はテストとして以下のようなファイルをアップロードしています。

アップロードが終わったらフローボットに戻り、テストしましょう。
テストが成功すると「テスト成功」の画面が表示され、Google Driveから取得した情報を引用できるようになります。
詳しくは以下のリンク先を参照してください。
アウトプットについて
テストが終わったら、「保存する」をクリックするのを忘れないようにしましょう!

ステップ4:OCRで読み取る設定

次に、「ファイルをダウンロード」のアイコンをクリックします。

Google Driveと連携するアカウント情報はプルダウンから選択します。
アクションには「ファイルをダウンロードする」を選びましょう。
入力が終わったら、「次へ」を押して進めてください。

ファイルIDを設定しましょう。
ファイルIDは元から入力されているので、そのままテストをクリックしましょう。
なお、どのくらいのファイルサイズまで対応してるかは、こちらで確認できますよ。

テストが成功すると、以下のような画面が表示されます。
問題がなければ、「保存する」をクリックしましょう。

次に、「画像・PDFから文字を読み取る」のアイコンをクリックします。

OCRのAIオペレーションはチームプラン・サクセスプランでのみご利用いただける機能となっております。
フリープランやミニプランではこのオペレーションを使うことができず、設定してもエラーになりますのでご注意くださいね。
なお、ミニプランをはじめとする有料プランは2週間の無料トライアルが可能です!

タイトルとアクションを設定します。
今回はどちらもデフォルトのままでOKです。
なお、デフォルトのアクションでは、5タスクが使われます。タスク実行数について詳しくはこちらを参考にしてみてください。
設定の流れや気をつけたいポイントは、下のリンク先から確認できます。
「画像・PDFから文字を読み取る」の設定方法
画像・PDFから文字情報を読み取るオペレーションで実施できること/できないこと

各項目を設定していきます。

  • ファイルの添付方法:プルダウンで「ファイルをアップロード」か「取得した値を使用」か選択できます。今回は「取得した値を使用」を選択しています。
  • 抽出したい項目:デフォルトでは本文を抽出するように設定されています。
    追加で抽出したい項目がある場合は、カンマ(,)で区切って入力しましょう。
  • 使用するAI:プルダウンから選択できます。
  • 言語:デフォルトでは英語になっていますが、今回は日本語を選択しています。

その他の項目は任意ですが、必要なら注釈を見ながら入力してみてください。

設定が終わったら、まずは「テスト」をクリックしましょう。
テストが成功すると「テスト成功」の画面が表示され、ファイルから取得した情報を引用できるようになります。
テストが成功したら、「保存する」をクリックするのを忘れないようにしましょう!

ステップ5:Geminiで要約する設定

次に、「コンテンツを生成」のアイコンをクリックします。

Geminiと連携するアカウント情報はプルダウンから選択します。
アクションには「コンテンツを生成」を選びましょう。
入力が終わったら、「次へ」を押して進めてください。

各項目を設定していきます。

  • モデル:入力欄をクリックし、候補の中から選択しましょう。
  • プロンプト:元から設定されています。編集欄をクリックすると、要約されたテキストを引用できます。
    今回は設定を変えずに、そのまま使っていきましょう。
  • systemInstruction:この項目もあらかじめ設定されているため、今回は特に変更せずそのままとしています。
    設定が終わったら「テスト」をクリックしましょう。

画面に「テスト成功」と表示されたら、最後に「保存する」をクリックしましょう!

ステップ6:Gmailで送信する設定

最後に、「メールを送る」のアイコンをクリックします。

Gmailと連携するアカウント情報はプルダウンから選択します。

メール内容を設定していきます。

Toの部分にはメールアドレスを入力しましょう。
件名、本文は編集欄をクリックすると、先ほど取得した情報が表示されます。ファイル名など、必要に応じて活用してくださいね。
なお、詳しい設定方法については以下のリンク先を参照してください。
「メールを送付する」の設定方法
設定が終わったら「次へ」をクリックしましょう。

メールのプレビューが表示されます。
内容を確認した後「テスト」をクリックしましょう。

画面に「テスト成功」と表示されたら、最後に「保存する」をクリックしましょう!
Gmailの画面でもちゃんと追加されているか確認しておくと安心です。

ステップ7:テストと確認

おつかれさまでした!以上で設定はすべて完了です。
設定が終わると、以下のような画面が表示されます。
「トリガーをON」をクリックすると、フローボットが起動します。

以上が、Google Driveに格納されたファイルをOCRで読み取り、Geminiで要約してGmailで送信する方法でした!

GeminiやOCRを使ったその他の自動化例

GeminiやOCRの機能を活用することで、様々な業務の自動化が実現できます。

Geminiを使った自動化例

Notionに追加されたミーティング記録やJotformの回答内容、Gmailで受信したメールをGeminiで要約して、関係者に自動通知することができます。また、YouTubeで新しい動画が公開された際にSNS用の投稿文を自動生成したり、Discordで投稿された内容に応じて自動で返信文を生成したりすることも可能です。

OCRを使った自動化例

Outlookの添付ファイルやSlackで送信されたファイル、Dropboxに追加された書類などをOCRで読み取って、Microsoft Excel・Googleスプレッドシート・Airtableに自動で追加することができます。また、DocuSignで契約が完了した際や名刺データの取り込み時にも、OCRで情報を抽出して、Microsoft Teamsへの通知やスクリプト実行など、業務フローに沿った処理が可能です。

まとめ

この記事では、「OCRで読み取ったファイルの情報をGeminiで自動要約する方法」について、プログラミング不要で実現できる手順をご紹介しました。
ファイルから自動で文字情報を抽出し、AIが要点を要約して通知や記録まで行うことで、資料確認や情報共有にかかる工数を大幅に削減できます。

<span class="mark-yellow">Yoomには、今回ご紹介したOCR × Geminiの自動化以外にも、さまざまな業務を効率化できるテンプレートが豊富に用意されています。</span>
ミーティングメモの要約や、アンケート回答の整理、SNS投稿文の自動生成など、幅広いシーンで活用可能です。
「毎回同じような内容をまとめるのが大変」「情報共有をもっとスムーズにしたい」「手作業によるミスを減らしたい」と感じている方は、ぜひYoomの自動化テンプレートを試してみてください。

まずはテンプレートを使って、業務の時短・効率化を実感してみましょう!
👉 今すぐ無料でアカウントを発行する

この記事を書いた人
n.fukuoka
ツールがどんどん増えていく今の時代、何を使えばいいのか迷ってしまうことも多いですよね。 そんな皆様の仕事が少しでも楽になるよう、わかりやすく役立つ情報をお届けしていきたいと思っています!
タグ
Gemini
自動化
自動
連携
OCR
関連アプリ
アプリ連携
No items found.
Yoomのハイパーオートメーションとは?
従来のRPAでは単純な繰り返し作業しか自動化できず、その設定作業はとても複雑なものでした。
AI・API・RPA・OCRなど様々な技術を組み合わせた「ハイパーオートメーション」なら、これまでは実現できなかった多くの作業を、これまでよりも簡単に自動化することが可能です。
Yoomのハイパーオートメーションとは?
従来のRPAでは単純な繰り返し作業しか自動化できず、その設定作業はとても複雑なものでした。
AI・API・RPA・OCRなど様々な技術を組み合わせた「ハイパーオートメーション」なら、これまでは実現できなかった多くの作業を、これまでよりも簡単に自動化することが可能です。
Yoomについて詳しく見る
お役立ち資料
Yoomがわかる!資料3点セット
資料ダウンロード
3分でわかる!Yoomサービス紹介資料
資料ダウンロード
Before Afterでわかる!Yoom導入事例集
資料ダウンロード
お役立ち資料一覧を見る