・
「請求書をスキャンしてPDFにしたけれど、テキストをコピーできず手入力している…」「紙書類をデータ化したい。でも、一つ一つ文字起こしするのは面倒…」
このように、PDFの扱いにくさや非効率な手作業に悩んでいませんか?
もし、<span class="mark-yellow">PDFファイルから自動でテキストを抽出し、「読み取り可能なPDF」に変換できる仕組み</span>があれば、面倒な作業から解放されます。
今回ご紹介する自動化の設定は、プログラミングの知識がなくても簡単に設定できるので、ぜひこの機会に導入して、書類のデータ化作業を効率化してみてください。
Yoomには<span class="mark-yellow">スキャンされたPDFを読み取り可能なPDFに変換する業務フロー自動化のテンプレート</span>が用意されています。「まずは試してみたい!」という方は、以下のバナーをクリックして、すぐに自動化を体験してみましょう!
様々なツールで受け取ったスキャンPDFを、自動でOCR(光学的文字認識)処理し、「読み取り可能なPDF」に変換する自動化の方法を、具体的なテンプレートを用いてご紹介します。
<span class="mark-yellow">Gmailなどで受け取ったスキャンPDFをトリガーにして、自動でOCR処理を行い、読み取り可能なPDFを生成</span>します。
この連携により、メールで届く請求書や契約書などの管理・検索を楽にすることが可能です。
<span class="mark-yellow">Discordなどで共有されたスキャンPDFを自動で認識し、読み取り可能なPDFに変換する</span>ことで、スムーズな情報共有とデータ活用を促進できます。
<span class="mark-yellow">Yoomのフォーム機能などを通じてアップロードされたスキャンPDFファイルを起点に、自動で読み取り可能なPDFを生成する</span>ことも可能です。
申請書や申込書などの受付業務を効率化します。
それではここから代表的な例として、Gmailで特定のメールを受信した際、添付されたスキャンPDFをOCR処理し、テキスト検索可能なPDFとしてBoxに自動で保存するフローを解説していきます!
ここではYoomを使用してノーコードで設定をしていくので、もしまだYoomのアカウントをお持ちでない場合は、こちらの登録フォームからアカウントを発行しておきましょう。
※今回連携するアプリの公式サイト:Gmail
[Yoomとは]
今回は大きく分けて以下のプロセスで作成します。
ここでは、Yoomとそれぞれのアプリを連携し、操作が行えるようにします。
まずは、基本的な設定方法を解説しているナビをご覧ください。
Gmail
Googleドキュメント
Googleドキュメントを検索・選択後、「Sign in with Google」をクリックします。
次に、アカウントを選択してください。
アカウントをクリックすると、追加アクセスを求められる場合があります。内容を確認し、先に進むとマイアプリ登録の完了です。
Box
使用するテンプレートを選び、「このテンプレートを試す」をクリックします。
自動化フローの設定画面(フローボット)が開き、「テンプレートがコピーされました」と表示されるので「OK」をクリックしてください。
※以降、コピーしたフローボットは、管理画面内プロジェクト一覧の「マイプロジェクト」からアクセスできます。
ここからは、フローの起点となるトリガーアクションの設定です。
一つ目のオペレーションにある、「特定のラベルのメールを受信したら」をクリックしてください。
続いて、連携アカウントとアクションを選択に進みます。各項目の確認・入力をし、次に進みましょう!
次に、アプリトリガーのAPI接続設定です。
「トリガーの起動間隔」を確認し、「ラベル」は候補から選択します。
【要確認】トリガーの起動間隔について
【要確認】テストを行う際の注意点
この記事では、サンプルとして以下の画像ファイル(PNG)を添付しています。
テストが成功すると、以下のように「取得した値」が表示されます。
※「取得した値」は、後のフローで使用します。
「件名」などが正しく反映されているかを確認し、「保存する」をクリックしましょう。
Gmailで受信したファイルから文字を読み取るための設定をします。
二つ目のオペレーションにある、「OCRで文字を抽出」をクリックしてください。
続いて、アクションを選択に進みます。
それぞれの内容を確認し、「次へ」をクリックしましょう。
【要確認】OCRについて
次に、詳細を設定に移ります。
以下を参考に必要項目を設定し、「テスト」をクリックしてください。
※YoomのOCR機能では、アクション記載の規定の文字数を超えるデータや文字が小さすぎる場合に正しく読み取れないことがあります。文字数や文字の大きさには少し余裕を持たせてご利用ください。
テストの成功を確認して「保存する」をクリックしましょう。
ファイルから読み取った文字を、PDFにするための設定をします。
三つ目のオペレーションにある、「書類を発行する」をクリックしてください。
続いて、書類の連携に進みます。
まずは、各項目の確認・入力をしてください。
「雛形書類の連携」は、候補から選択します。
※このオペレーションでは、PDFを作成するための雛形書類が必要です。雛形書類がない場合は、Googleドキュメントで作成してみてください。
雛形書類の例
「格納先のGoogle DriveフォルダID」を候補から選択し、「出力ファイル名」は取得した値から選択します。
※取得した値を使用することで、毎回最新のファイルをPDFとして発行することが可能です。
設定後、「次へ」をクリックしましょう。
次に、置換条件の設定です。
「置換対象の文字列」は、作成した雛形書類の値が入力されていますので、そのままにしておきましょう。
※書類の内容を追加したいときや更新した場合は、「置換条件を再取得」をクリックしてください。
「置換後の文字列」を、取得した値からそれぞれ選択します。
テストが成功すると、以下のように表示されます。
実際に、「ダウンロード」をクリックして、指定したとおりに置換できているかどうか確認してみましょう。
確認後、「保存する」をクリックしてください。
作成したPDFをBoxに格納するための設定をします。
最後のオペレーションにある、「ファイルをアップロード」をクリックしてください。
続いて、連携アカウントとアクションを選択に進みます。各項目を確認し、「次へ」をクリックしましょう。
次に、API接続設定です。
「ファイル名」を取得した値から選択し、「格納先フォルダのコンテンツID」は手動で入力します。
「ファイルの添付方法」「ファイル」を確認後、「テスト」をクリックしてください。
テストを実行し、BoxにPDFがアップロードされていれば、設定完了です。
確認後、管理画面の「保存する」をクリックしてください。
最後にトリガーをONにして、作成したフローボットが正常に動作するか確認しておきましょう。
OCR機能やGmailを使った自動化は、今回ご紹介したWebページのスクリーンショット以外にも様々な業務に応用できます。
ここでは、関連するテンプレートをいくつかご紹介します。日々の業務効率化のヒントとして、ぜひ参考にしてください。
フォームのPDFやメールの見積書をOCRで読み取り、ExcelやGoogleスプレッドシートにデータ化し、Workplaceに通知できます。
また、ファイルをOCRで解析し、DeepLで翻訳したり、Groqで要約してドキュメントに追加したり、SalesforceなどのCRMでリードを作成したりと、書類処理を効率化します。
Gmailで受信した添付ファイルをGoogle DriveやDropboxに自動でアップロードできます。
また、添付ファイルをAdobe Acrobat Signにアップロードして署名プロセスに連携することも可能です。SmartHRに従業員が登録されたらGmailで通知したり、お問い合わせメールを受信したらDifyで回答内容を作成して通知したりと、メールとファイル、そして外部サービスとの連携を効率化できます。
スキャンされたPDFを自動で読み取り可能なPDFに変換することで、<span class="mark-yellow">手作業での転記や、目視での情報確認といった作業を減らすとともに、ヒューマンエラーのリスクも削減</span>できます。
ノーコードツール「Yoom」を使えば、画面の指示に従って操作するだけで直感的に業務フローを構築できるので、ぜひこちらから無料登録して、Yoomがもたらす業務効率化を体験してみてください!
Q:手書き文字や複雑なレイアウトの書類も読み取れますか?
A:YoomのOCRは、PDFや画像から高い精度で文字を抽出できますが、ファイルの内容や形式によって結果が変わります。
例えば、項目名が明確で値がユニーク、かつ文字数が6,500文字以内であれば高精度での抽出が可能ですが、縦書きや複雑なレイアウト、大量の文字などは精度が低下することがあります。
「OCRで文字を抽出」で実施できること/できないこと
Q:請求書や契約書など、機密情報を含む書類をアップロードしても安全ですか?
A:Yoomでは、安心してご利用いただけるよう複数のセキュリティ対策を実装しています。
連携先アプリから取得したデータは、Yoom上に保存・共有されることはありません。連携処理の中でのみ使用されるため、機密情報が意図せず残ることはありません。
詳しくはこちらをご覧ください。
2要素認証や、SAML認証(エンタープライズプランのみ)など、アクセス制御の仕組みも備えています。
詳しくはこちらをご覧ください。
Q:連携に失敗した場合、どのように通知され、どう対処すればよいですか?
A:自動化フローでエラーが発生した場合、フローボット内でエラーとして記録され、通知設定をしておくとメールなどで自動通知されます。
なお、自動での再実行(リトライ)は行われないため、エラー発生時は手動での再実行が必要です。
エラー時の対応方法について