ストレージに追加されたファイルをOCRで読み取り、Difyで処理する
Google DriveやMicrosoft SharePointなどのストレージサービスにファイルが追加されると、自動でOCR処理を行い、Difyで内容を要約してSlackに通知します。
ファイルがアップロードされた後の確認や連絡といった作業を自動化できるため、チームで共有している書類の内容を関係者に素早く共有したい場合に便利ですね!
・
「書類や画像ファイルに含まれるテキスト情報をもっとうまく活用したいけれど、手作業での転記や要約には時間がかかりすぎる…」と感じていませんか?
確かに、日々大量に受け取るファイルの内容を確認し、必要な情報を抽出・整理するのは骨の折れる作業ですよね。
このような時にご紹介したいのが、DifyとOCRの連携による業務の自動化です!
<span class="mark-yellow">実は、Difyのような生成AIツールとOCR(光学的文字認識)技術を組み合わせることで、こうした課題を解決できるかもしれません。</span>
具体的には、受信したファイルからOCRでテキストを抽出し、Difyでその内容を要約したり、特定の情報を抜き出したりといった処理の自動化が可能です。なんだか便利そうな気がしますよね…!
そこでこの記事では、プログラミング不要でDifyとOCRを連携させ、ファイル内のテキスト処理を自動化する具体的な方法とその活用例について解説します。
毎日の業務がより簡単に、そして効率的になるかもしれません。必見です!
「ファイルを受信したらOCRで読み取り、Difyで処理して通知する」業務フローをすぐに試したい!という方へ。
Yoomには、この自動化を実現するテンプレートが用意されています。以下のボタンをクリックして、早速始めてみましょう!
DifyとOCRを組み合わせることで、受け取ったファイルの内容を自動で読み取り、要約して通知するなど、様々な業務の効率化が期待できます。
実際の例をいくつか紹介していきますので、業務に合ったテンプレートを見つけて、すぐに自動化を試してみませんか?
GmailやOutlookでファイル付きメールを受け取ったら、自動でOCR処理。Difyで内容を要約してSlackに通知します。
これにより、メールに添付された請求書や報告書の内容を確認する手間を減らし、迅速な対応が可能になるかもしれません!
Google DriveやMicrosoft SharePointなどのストレージサービスにファイルが追加されると、自動でOCR処理を行い、Difyで内容を要約してSlackに通知します。
ファイルがアップロードされた後の確認や連絡といった作業を自動化できるため、チームで共有している書類の内容を関係者に素早く共有したい場合に便利ですね!
SlackやMicrosoft Teamsでファイルが共有された際に、自動でOCR処理し、Difyで内容を要約してSlackに通知します。
チャットでのファイル共有が多い場合に、内容の確認や転記作業を自動化できるので、コミュニケーションを円滑に進めるのに役立つはずです!
それでは、ここから実際に自動化を導入する設定方法について紹介します!
今回はより具体的な業務フローの一例として「Gmailで特定の条件に合致するメール(例:件名に「請求書」が含まれ、添付ファイルがある)を受信したら、添付ファイルをOCRで読み取り、その内容をDifyで要約してSlackに通知する」という自動化の作成プロセスを解説します。
今回はYoomを使用してノーコードで設定を進めていきますので、まだYoomのアカウントをお持ちでない場合はこちらの登録フォームからアカウントを発行しておきましょう。
[Yoomとは]
大きく分けて、以下の手順で作成していきます。
GmailとDifyをYoomに接続するためのマイアプリ登録を行いましょう。
最初にマイアプリ登録を済ませておくと、自動化設定がスムーズに進められます。
なお、今回はファイルデータをOCRで抽出するため、連携前にGmailでファイルを送信しておきましょう!
※今回は、以下画像のようなメールを送信しました。
※ファイルの中身は、以下の画像です。
1.Yoomページ画面左側のマイアプリをクリックし、「新規接続」を選択します。
右上の検索窓に「Gmail」と入力し、検索結果からGmailのアイコンを選択します。
2.表示された画面で、「Sign in with Google」をクリックしてください。
次の画面で、アカウントを選択し、その後の画面で「続行」をクリックして進みましょう!
3.続いてDifyをマイアプリ登録します。
先ほどと同様の手順で、Difyを検索します。
次の画面で、必須項目を入力し、「追加」をクリックします。
※Difyのマイアプリ連携方法はこちらをご参照ください。
今回、設定するテンプレートはSlackも使用するため、Slackもマイアプリ登録します。
先ほどと同様の手順で、Slackを検索します。
次の画面で、URLを入力し、「続行する」をクリックします。
表示された画面で、「許可する」をクリックしてください。
マイアプリにGmailとDify、Slackが表示されていれば、登録完了です!
ここから、フローを作っていきましょう!
テンプレートを利用して進めるため、以下の『このテンプレートを試してみる』をクリックしてください。
ワークスペースに自動的にテンプレートがコピーされます。次に表示された画面で「OK」をクリックしてください。
※以下の画面は、Yoomページ画面左側「マイプロジェクト」のフローボットで表示される、「【コピー】Gmailでファイルが送信されたらOCRで読み取り、Difyで要約しSlackに通知する」をクリックすると表示されます。
1.アプリトリガー「特定のラベルのメールを受信したら」を選択します。
2.表示された画面で各項目を確認します。
アカウント情報を任意で設定し、トリガーアクションはそのままにして、「次へ」をクリックしましょう。
3.表示された画面で、詳細を設定します。
「トリガーの起動間隔」を選択してください。
※基本的には、最短の時間で設定するのが、おすすめです!
※トリガーは5分、10分、15分、30分、60分の間隔で起動間隔を選択できます。プランによって最短の起動間隔が異なりますので、ご注意ください。
※Yoomプランの詳しい説明は、こちらを参照してください。
4.「ラベル」は、入力欄をクリックして表示される候補から選択してくださいね。
5.入力を終えたら、「テスト」を実行し、成功したら「保存する」をクリックします。
※表示されているアウトプットはテスト毎に取得できるものです。なお、その後の設定で活用するデータとなります。
1.「画像・PDFから文字を読み取る」をクリックしてください。
※・OCRや音声を文字起こしするAIオペレーションは、チームプラン・サクセスプラン限定の機能です。フリープランやミニプランでセットするとエラーになってしまうので、ご注意ください。
・チームプランやサクセスプランなどの有料プランは、2週間の無料トライアルが可能です。トライアル期間中は、通常だと制限があるアプリやAIオペレーションもすべて使えるので、この機会にぜひ気になる機能をぜひお試しください!
※YoomのOCR機能では、アクション記載の規定の文字数を超えるデータや、文字が小さすぎる場合に正しく読み取れないことがあります。文字数や文字の大きさには少し余裕を持たせてご利用ください。
2.各項目を確認し、「次へ」をクリックしてください。
3.詳細設定を行います。
「ファイルの添付方法」はデフォルトで、先ほど添付したファイルが対象になっています。特にこだわりがなければこのままで大丈夫です!
「抽出したい項目」は、抽出したい項目を入力します。今回は以下の画像のように入力しました!
入力を終えたら「テスト」を実行し、成功したら「保存する」をクリックします。
1.アプリと連携する「チャットメッセージを送信」をクリックしてください。
各項目を確認し、「次へ」をクリックしましょう。
2.API接続設定を行います!
「query」は、入力欄をクリックして表示されるアウトプット(先ほど取得した値)から選択してください。
「user」は、入力欄下の説明に従って入力してください。
入力を終えたら「テスト」を実行し、成功したら「保存する」をクリックします。
1.次が最後の設定です!アプリと連携する「チャンネルにメッセージを送る」をクリックしてください。
各項目を確認し、「次へ」をクリックします。
2.API接続設定を行います!
「投稿先のチャンネルID」は、入力欄をクリックして表示される候補から選択してくださいね。
「メッセージ」は、入力欄をクリックして表示されるアウトプット(取得した値)から選択できます。
※今回は、以下画像のように設定しました。
入力を終えたら「テスト」を実行し、成功したら「保存する」をクリックします。
<span class="mark-yellow">※設定が完了すると、以下画像のようにSlackに通知されます!</span>
以下の画面の赤枠部分「トリガーをON」ボタンをクリックすると、フローボットが待機状態(トリガーが発動次第フローが起動する状態)になります!
DifyやOCRを使った自動化はまだまだたくさんあります!
ここでは、関連するYoomのテンプレートをいくつかご紹介します。業務改善のヒントが見つかるかもしれません!
今回は、DifyとOCRを連携させて、ファイル内のテキスト処理を自動化する方法についてご紹介しました。
メールやチャット、ストレージサービスで受け取ったファイルからOCRでテキストを抽出できれば、そのままDifyで要約が行えるようになるため、今まで以上にAIを活用した業務がスムーズになる可能性がありますよね。<span class="mark-yellow">結果としてより効率的に業務が進むかもしれません!</span>
なお、Yoomのようなノーコードツールを使えば、プログラミングの知識がなくても、これらの連携を簡単に実現できます。
今回ご紹介したテンプレートを活用すれば、すぐに自動化を試すことが可能です!
まずは無料プランから、その効果を体験してみてくださいね!