【ノーコードで実現】Google Driveに格納されたファイルをOCRで読み取り、Geminiで要約してGmailで送信する方法

‍とにかく早く試したい方へ

Yoomには「Google Driveに格納されたファイルをOCRで読み取り、Geminiで要約してGmailで送信する」自動化のテンプレートが用意されています。
「まずは試してみたい！」という方は、以下のバナーをクリックして、すぐに自動化を体験してみましょう！

「このファイル、誰が確認するんだっけ？」
「内容を確認して要約して、関係者に送るだけで半日終わってしまう…」

画像やPDFで送られてくる資料や会議後に共有されるホワイトボードの写真、現場から届く手書きメモなど内容を確認して整理して、社内の関係者に共有する作業は思った以上に時間と手間がかかりますよね。そんな日々の非効率を解消するのが、OCRとGeminiを活用したファイル情報の自動処理です。たとえば、営業資料の確認結果を自動で共有する作業や、アップロードされた見積書を要約して記録するといった作業が、人の手を介さず自動で進めることができるようになります。

本記事では、ストレージサービスに格納されたファイルをOCRで読み取りGeminiで要約して、その情報をGmailで自動送信する方法や、SlackやDiscordなどのチャットツールに自動通知する方法について画像付きで詳しく解説していきます。煩雑なファイル整理に悩まされている方は要チェックです！

ファイルからOCRで読み取り、共有する自動化例

GeminiのOCR機能を活用し、画像やPDFファイルから抽出した文字情報を様々なツールへ連携・活用する自動化テンプレートを紹介します！
気になる内容があれば、ぜひクリックしてみてください！

抽出・要約した情報をメールで送信する

ストレージサービスに格納されたファイルをOCRで読み取り、Geminiで要約した結果をGmailやOutlookといったメールツールで自動送信します。
ファイルの内容確認や報告の手間が省け、関係者への情報共有をスムーズに行えます！

抽出した情報をチャットツールに通知する　

ストレージサービスにアップロードされた画像ファイルをGeminiが解析し、その内容をSlackやDiscordなどのチャットツールへ自動で通知します。
画像の内容確認や情報共有の手間を削減し、迅速なコミュニケーションを実現しましょう！

抽出・要約した情報をデータベース/CRMサービスに記録する

ストレージサービスにあるファイルをOCRで読み取り、Geminiで要約した内容をGoogle スプレッドシートやNotionのようなデータベース/CRMサービスに自動で追加・記録します。
手作業でのデータ入力や転記ミスを防ぎ、効率的な情報管理体制を構築できます！

Google Driveのファイルを要約してGmailで送るフローを作ってみよう

それではここから代表的な例として、Google Driveに特定のファイルが格納された際に、そのファイルをOCRで読み取り、Geminiで内容を要約してGmailで自動送信するフローを解説していきます！
今回はYoomを使用してノーコードで設定を進めていきますので、もしまだYoomのアカウントをお持ちでない場合は、こちらの登録フォームからアカウントを発行しておきましょう。

[Yoomとは]

フローの作成方法

作成の流れは大きく分けて以下です。

Google Drive・Gemini・Gmailのマイアプリ連携
テンプレートをコピーする
Google Driveのトリガー設定とOCR、Gemini、Gmailのアクション設定
トリガーをONに設定しフロー稼働の準備完了

ステップ1: Google Drive・Gemini・Gmailのマイアプリ連携

ここでは、Yoomとそれぞれのアプリを連携して、操作が行えるようにしていきます。
まずは基本的な設定方法を解説しているナビをご覧ください！

それではここから今回のフローで使用するアプリのマイアプリ登録方法を解説します。

‍Google Driveのマイアプリ登録

では、さっそくGoogle Driveからマイアプリ登録していきましょう！
入力欄にGoogle Driveと入力するとGoogle Driveのアイコンが表示されるので、アイコンをクリックします。

1.以下の画面が出てきます。
「Sign in with Google」をクリックしてください。

2.連携したいアカウントを選択しましょう。

3.以下の画面が表示されます。
「次へ」をクリックしてください。
その後、アクセスを求められるので、内容を確認した後「続行」をクリックしてください。

Geminiのマイアプリ登録

Geminiも同じように検索して、アイコンをクリックします。

1.以下の画面が出てきます。
アカウント名には使いやすい名前を自由に入力しましょう。
アクセストークンはこちらから取得できます。

Gmailのマイアプリ登録

以下の手順をご参照ください。

マイアプリ登録が成功すると、以下の画面が表示されます。
マイアプリの画面に Google Drive・Gemini・Gmailのアイコンが表示されているか確認してください。

ステップ2：テンプレートをコピー

以下のリンクから「試してみる」をクリックしてください。

以下の表示が出たら、テンプレートのコピーが成功です。
コピーしたテンプレートはマイプロジェクトに格納されます

ステップ3:特定のフォルダ内に新しくファイル・フォルダが作成されたら起動するトリガーの設定

まず、一番上の「特定のフォルダ内に新しくファイル・フォルダが作成されたら」のアイコンをクリックします。

Google Driveと連携するアカウント情報はプルダウンから選択します。
トリガーには「特定のフォルダ内に新しくファイル・フォルダが作成されたら」を選びましょう。
入力が終わったら、「次へ」を押して進めてください。

各項目を設定していきます。

トリガーの起動間隔：5分、10分、15分、30分、60分の間隔で起動間隔を選択できます。
プランによって設定できる最短の間隔が異なるので、事前に確認してくださいね！

フォルダID：入力欄をクリックすると候補が表示されるので、その中から選択しましょう。

設定が終わったらテストのため、Google Driveの画面でファイルをアップロードしてください。
なお、今回はテストとして以下のようなファイルをアップロードしています。

アップロードが終わったらフローボットに戻り、テストしましょう。
テストが成功すると「テスト成功」の画面が表示され、Google Driveから取得した情報を引用できるようになります。
詳しくは以下のリンク先を参照してください。
アウトプットについて
テストが終わったら、「保存する」をクリックするのを忘れないようにしましょう！

ステップ4:OCRで読み取る設定

次に、「ファイルをダウンロード」のアイコンをクリックします。

Google Driveと連携するアカウント情報はプルダウンから選択します。
アクションには「ファイルをダウンロードする」を選びましょう。
入力が終わったら、「次へ」を押して進めてください。

ファイルIDを設定しましょう。
ファイルIDは元から入力されているので、そのままテストをクリックしましょう。
なお、どのくらいのファイルサイズまで対応してるかは、こちらで確認できますよ。

テストが成功すると、以下のような画面が表示されます。
問題がなければ、「保存する」をクリックしましょう。

次に、「画像・PDFから文字を読み取る」のアイコンをクリックします。

OCRのAIオペレーションはチームプラン・サクセスプランでのみご利用いただける機能となっております。
フリープランやミニプランではこのオペレーションを使うことができず、設定してもエラーになりますのでご注意くださいね。
なお、ミニプランをはじめとする有料プランは2週間の無料トライアルが可能です！

タイトルとアクションを設定します。
今回はどちらもデフォルトのままでOKです。
なお、デフォルトのアクションでは、5タスクが使われます。タスク実行数について詳しくはこちらを参考にしてみてください。
設定の流れや気をつけたいポイントは、下のリンク先から確認できます。
「画像・PDFから文字を読み取る」の設定方法
画像・PDFから文字情報を読み取るオペレーションで実施できること/できないこと

各項目を設定していきます。

ファイルの添付方法：プルダウンで「ファイルをアップロード」か「取得した値を使用」か選択できます。今回は「取得した値を使用」を選択しています。

抽出したい項目：デフォルトでは本文を抽出するように設定されています。
追加で抽出したい項目がある場合は、カンマ（,）で区切って入力しましょう。

使用するAI：プルダウンから選択できます。

言語：デフォルトでは英語になっていますが、今回は日本語を選択しています。

その他の項目は任意ですが、必要なら注釈を見ながら入力してみてください。

設定が終わったら、まずは「テスト」をクリックしましょう。
テストが成功すると「テスト成功」の画面が表示され、ファイルから取得した情報を引用できるようになります。
テストが成功したら、「保存する」をクリックするのを忘れないようにしましょう！

‍

ステップ5:Geminiで要約する設定

次に、「コンテンツを生成」のアイコンをクリックします。

Geminiと連携するアカウント情報はプルダウンから選択します。
アクションには「コンテンツを生成」を選びましょう。
入力が終わったら、「次へ」を押して進めてください。

各項目を設定していきます。

モデル：入力欄をクリックし、候補の中から選択しましょう。

プロンプト：元から設定されています。編集欄をクリックすると、要約されたテキストを引用できます。
今回は設定を変えずに、そのまま使っていきましょう。

systemInstruction：この項目もあらかじめ設定されているため、今回は特に変更せずそのままとしています。
設定が終わったら「テスト」をクリックしましょう。

画面に「テスト成功」と表示されたら、最後に「保存する」をクリックしましょう！

ステップ6:Gmailで送信する設定

最後に、「メールを送る」のアイコンをクリックします。

Gmailと連携するアカウント情報はプルダウンから選択します。

メール内容を設定していきます。

Toの部分にはメールアドレスを入力しましょう。
件名、本文は編集欄をクリックすると、先ほど取得した情報が表示されます。ファイル名など、必要に応じて活用してくださいね。
なお、詳しい設定方法については以下のリンク先を参照してください。
「メールを送付する」の設定方法
設定が終わったら「次へ」をクリックしましょう。

メールのプレビューが表示されます。
内容を確認した後「テスト」をクリックしましょう。

画面に「テスト成功」と表示されたら、最後に「保存する」をクリックしましょう！
Gmailの画面でもちゃんと追加されているか確認しておくと安心です。

ステップ7:テストと確認

おつかれさまでした！以上で設定はすべて完了です。
設定が終わると、以下のような画面が表示されます。
「トリガーをON」をクリックすると、フローボットが起動します。

以上が、Google Driveに格納されたファイルをOCRで読み取り、Geminiで要約してGmailで送信する方法でした！

GeminiやOCRを使ったその他の自動化例

GeminiやOCRの機能を活用することで、様々な業務の自動化が実現できます。

Geminiを使った自動化例

Notionに追加されたミーティング記録やJotformの回答内容、Gmailで受信したメールをGeminiで要約して、関係者に自動通知することができます。また、YouTubeで新しい動画が公開された際にSNS用の投稿文を自動生成したり、Discordで投稿された内容に応じて自動で返信文を生成したりすることも可能です。

OCRを使った自動化例

Outlookの添付ファイルやSlackで送信されたファイル、Dropboxに追加された書類などをOCRで読み取って、Microsoft Excel・Googleスプレッドシート・Airtableに自動で追加することができます。また、DocuSignで契約が完了した際や名刺データの取り込み時にも、OCRで情報を抽出して、Microsoft Teamsへの通知やスクリプト実行など、業務フローに沿った処理が可能です。

まとめ

この記事では、「OCRで読み取ったファイルの情報をGeminiで自動要約する方法」について、プログラミング不要で実現できる手順をご紹介しました。
ファイルから自動で文字情報を抽出し、AIが要点を要約して通知や記録まで行うことで、資料確認や情報共有にかかる工数を大幅に削減できます。

<span class="mark-yellow">Yoomには、今回ご紹介したOCR × Geminiの自動化以外にも、さまざまな業務を効率化できるテンプレートが豊富に用意されています。</span>
ミーティングメモの要約や、アンケート回答の整理、SNS投稿文の自動生成など、幅広いシーンで活用可能です。
「毎回同じような内容をまとめるのが大変」「情報共有をもっとスムーズにしたい」「手作業によるミスを減らしたい」と感じている方は、ぜひYoomの自動化テンプレートを試してみてください。

まずはテンプレートを使って、業務の時短・効率化を実感してみましょう！
👉 今すぐ無料でアカウントを発行する

よくあるご質問

Q：要約の文字数や形式を調整する方法はありますか？

A：プロンプト設計で「役割」「出力形式」「文字数」を具体的に指定することで、調整することができます。
例えばYoomでは、Geminiに対して「あなたは業務報告書を要約するアシスタントです。重要な決定事項と担当者名を保持し、200字以内で簡潔にまとめてください。出力は箇条書き形式で」と指示できます。

‍

Q：Google Drive以外のストレージでも可能ですか？

A：はい。可能です。
Yoomでは、DropboxやOneDriveなどGoogle Drive以外のストレージでも「特定のフォルダ内でファイルが作成または更新されたら」のトリガーと「ファイルをダウンロード」のアクションを設定することで連携することができます。

‍

Q：OCRが対応しているファイル形式や言語は？

A：OCR機能ではPDFや画像ファイル（JPEG、PNG など）を対象に文字抽出が可能です。
印字された文字であれば高い精度で認識できますが、手書き文字や解像度の低い画像では精度が落ちる場合があります。
精度を安定させるためには、スキャンの解像度を上げたり、文字がはっきり見える状態のファイルを利用するのが推奨です。
※詳しくはこちらをご確認ください。