【ノーコードで実現】OCRで読み取ったファイルの情報をGeminiで自動要約する方法

ファイルからOCRで読み取り、共有する自動化例

GeminiのOCR機能を活用し、画像やPDFファイルから抽出した文字情報を様々なツールへ連携・活用する自動化テンプレートを紹介します！
気になる内容があれば、ぜひクリックしてみてください！

抽出・要約した情報をメールで送信する

ストレージサービスに格納されたファイルをOCRで読み取り、Geminiで要約した結果をGmailやOutlookといったメールツールで自動送信します。
ファイルの内容確認や報告の手間が省け、関係者への情報共有をスムーズに行えます！

抽出した情報をチャットツールに通知する　

ストレージサービスにアップロードされた画像ファイルをGeminiが解析し、その内容をSlackやDiscordなどのチャットツールへ自動で通知します。
画像の内容確認や情報共有の手間を削減し、迅速なコミュニケーションを実現しましょう！

抽出・要約した情報をデータベース/CRMサービスに記録する

ストレージサービスにあるファイルをOCRで読み取り、Geminiで要約した内容をGoogle スプレッドシートやNotionのようなデータベース/CRMサービスに自動で追加・記録します。
手作業でのデータ入力や転記ミスを防ぎ、効率的な情報管理体制を構築できます！

Google Driveのファイルを要約してGmailで送るフローを作ってみよう

それではここから代表的な例として、Google Driveに特定のファイルが格納された際に、そのファイルをOCRで読み取り、Geminiで内容を要約してGmailで自動送信するフローを解説していきます！
今回はYoomを使用してノーコードで設定を進めていきますので、もしまだYoomのアカウントをお持ちでない場合は、こちらの登録フォームからアカウントを発行しておきましょう。

[Yoomとは]

フローの作成方法

作成の流れは大きく分けて以下です。

Google Drive・Gemini・Gmailのマイアプリ連携
テンプレートをコピーする
Google Driveのトリガー設定とOCR、Gemini、Gmailのアクション設定
トリガーをONに設定しフロー稼働の準備完了

ステップ1: Google Drive・Gemini・Gmailのマイアプリ連携

まず、Yoomのアカウントにログインします。
まだYoomを利用したことがない方は、初めてのYoomをぜひご覧ください。

1.マイアプリをクリックした後、新規接続をクリックします。

2.入力欄からアプリ名で検索できます。

Google Driveのマイアプリ登録

では、さっそくGoogle Driveからマイアプリ登録していきましょう！
入力欄にGoogle Driveと入力するとGoogle Driveのアイコンが表示されるので、アイコンをクリックします。

1.以下の画面が出てきます。
「Sign in with Google」をクリックしてください。

2.連携したいアカウントを選択しましょう。

3.以下の画面が表示されます。
「次へ」をクリックしてください。
その後、アクセスを求められるので、内容を確認した後「続行」をクリックしてください。

Geminiのマイアプリ登録

Geminiも同じように検索して、アイコンをクリックします。

1.以下の画面が出てきます。
アカウント名には使いやすい名前を自由に入力しましょう。
アクセストークンはこちらから取得できます。

Gmailのマイアプリ登録

最後に、Gmailを検索しましょう！

1.以下の画面が表示されます。
「Sign in with Google」をクリックしましょう。
そこから先は、先ほどマイアプリ登録したGoogle Driveと進め方は同じです。

マイアプリ登録が成功すると、以下の画面が表示されます。
マイアプリの画面に Google Drive・Gemini・Gmailのアイコンが表示されているか確認してください。

ステップ2：テンプレートをコピー

以下のリンクから「試してみる」をクリックしてください。

以下の表示が出たら、テンプレートのコピーが成功です。
コピーしたテンプレートはマイプロジェクトに格納されます

ステップ3:特定のフォルダ内に新しくファイル・フォルダが作成されたら起動するトリガーの設定

まず、一番上の「特定のフォルダ内に新しくファイル・フォルダが作成されたら」のアイコンをクリックします。

Google Driveと連携するアカウント情報はプルダウンから選択します。
トリガーには「特定のフォルダ内に新しくファイル・フォルダが作成されたら」を選びましょう。
入力が終わったら、「次へ」を押して進めてください。

各項目を設定していきます。

トリガーの起動間隔：5分、10分、15分、30分、60分の間隔で起動間隔を選択できます。
プランによって設定できる最短の間隔が異なるので、事前に確認してくださいね！

フォルダID：入力欄をクリックすると候補が表示されるので、その中から選択しましょう。

設定が終わったらテストのため、Google Driveの画面でファイルをアップロードしてください。
なお、今回はテストとして以下のようなファイルをアップロードしています。

アップロードが終わったらフローボットに戻り、テストしましょう。
テストが成功すると「テスト成功」の画面が表示され、Google Driveから取得した情報を引用できるようになります。
詳しくは以下のリンク先を参照してください。
アウトプットについて
テストが終わったら、「保存する」をクリックするのを忘れないようにしましょう！

ステップ4:OCRで読み取る設定

次に、「ファイルをダウンロード」のアイコンをクリックします。

Google Driveと連携するアカウント情報はプルダウンから選択します。
アクションには「ファイルをダウンロードする」を選びましょう。
入力が終わったら、「次へ」を押して進めてください。

ファイルIDを設定しましょう。
ファイルIDは元から入力されているので、そのままテストをクリックしましょう。
なお、どのくらいのファイルサイズまで対応してるかは、こちらで確認できますよ。

テストが成功すると、以下のような画面が表示されます。
問題がなければ、「保存する」をクリックしましょう。

次に、「画像・PDFから文字を読み取る」のアイコンをクリックします。

OCRのAIオペレーションはチームプラン・サクセスプランでのみご利用いただける機能となっております。
フリープランやミニプランではこのオペレーションを使うことができず、設定してもエラーになりますのでご注意くださいね。
なお、ミニプランをはじめとする有料プランは2週間の無料トライアルが可能です！

タイトルとアクションを設定します。
今回はどちらもデフォルトのままでOKです。
なお、デフォルトのアクションでは、5タスクが使われます。タスク実行数について詳しくはこちらを参考にしてみてください。
設定の流れや気をつけたいポイントは、下のリンク先から確認できます。
「画像・PDFから文字を読み取る」の設定方法
画像・PDFから文字情報を読み取るオペレーションで実施できること/できないこと

各項目を設定していきます。

ファイルの添付方法：プルダウンで「ファイルをアップロード」か「取得した値を使用」か選択できます。今回は「取得した値を使用」を選択しています。

抽出したい項目：デフォルトでは本文を抽出するように設定されています。
追加で抽出したい項目がある場合は、カンマ（,）で区切って入力しましょう。

使用するAI：プルダウンから選択できます。

言語：デフォルトでは英語になっていますが、今回は日本語を選択しています。

その他の項目は任意ですが、必要なら注釈を見ながら入力してみてください。

設定が終わったら、まずは「テスト」をクリックしましょう。
テストが成功すると「テスト成功」の画面が表示され、ファイルから取得した情報を引用できるようになります。
テストが成功したら、「保存する」をクリックするのを忘れないようにしましょう！

‍

ステップ5:Geminiで要約する設定

次に、「コンテンツを生成」のアイコンをクリックします。

Geminiと連携するアカウント情報はプルダウンから選択します。
アクションには「コンテンツを生成」を選びましょう。
入力が終わったら、「次へ」を押して進めてください。

各項目を設定していきます。

モデル：入力欄をクリックし、候補の中から選択しましょう。

プロンプト：元から設定されています。編集欄をクリックすると、要約されたテキストを引用できます。
今回は設定を変えずに、そのまま使っていきましょう。

systemInstruction：この項目もあらかじめ設定されているため、今回は特に変更せずそのままとしています。
設定が終わったら「テスト」をクリックしましょう。

画面に「テスト成功」と表示されたら、最後に「保存する」をクリックしましょう！

ステップ6:Gmailで送信する設定

最後に、「メールを送る」のアイコンをクリックします。

Gmailと連携するアカウント情報はプルダウンから選択します。

メール内容を設定していきます。

Toの部分にはメールアドレスを入力しましょう。
件名、本文は編集欄をクリックすると、先ほど取得した情報が表示されます。ファイル名など、必要に応じて活用してくださいね。
なお、詳しい設定方法については以下のリンク先を参照してください。
「メールを送付する」の設定方法
設定が終わったら「次へ」をクリックしましょう。

メールのプレビューが表示されます。
内容を確認した後「テスト」をクリックしましょう。

画面に「テスト成功」と表示されたら、最後に「保存する」をクリックしましょう！
Gmailの画面でもちゃんと追加されているか確認しておくと安心です。

ステップ7:テストと確認

おつかれさまでした！以上で設定はすべて完了です。
設定が終わると、以下のような画面が表示されます。
「トリガーをON」をクリックすると、フローボットが起動します。

以上が、Google Driveに格納されたファイルをOCRで読み取り、Geminiで要約してGmailで送信する方法でした！

OCRやGeminiを使ったその他の自動化例

OCRやGeminiは単体でも十分に使えますが、普段使っているツールと組み合わせることで、活用の幅がぐっと広がります。
Yoomには、「こんなことができたらいいのに」という声に応えるテンプレートが豊富に揃っています。
効率化のヒントとして、気になるものがあればチェックしてみてくださいね！

OCRを使った自動化例

Outlookの添付ファイルやSlackで送信されたファイル、Dropboxに追加された書類などをOCRで読み取って、Microsoft Excel・Googleスプレッドシート・Airtableに自動で追加することができます。また、DocuSignで契約が完了した際や名刺データの取り込み時にも、OCRで情報を抽出して、Microsoft Teamsへの通知やスクリプト実行など、業務フローに沿った処理が可能です。