・
アラビア語で書かれた請求書や書類が届くたび、その内容を手作業で入力する業務に追われていませんか?
慣れない文字の判読に時間がかかったり、入力ミスが頻発したりと、このような手作業でのデータ化に限界を感じている方も多いかもしれません。
もし、<span class="mark-yellow">メールで受信したアラビア語のファイルやストレージに保存された書類を自動で読み取り、テキストデータを抽出できる仕組み</span>があれば、こうした面倒な手作業から解放され、より生産性の高いコア業務に集中する時間を生み出すことができます!
今回ご紹介する自動化の設定は、ノーコードで簡単に設定できて、手間や時間もかかりません。
ぜひ自動化を導入して作業をもっと楽にしましょう!
Yoomには<span class="mark-yellow">アラビア語のファイルをOCRで読み取りテキスト化する業務フロー自動化のテンプレート</span>が用意されています。
「まずは試してみたい!」という方は、以下のバナーをクリックして、すぐに自動化を体験してみましょう!
アラビア語で書かれた書類や画像ファイルから、手作業で文字を抜き出すのは大変な作業ですよね。そこでOCR機能を活用して自動化すれば、この手間を削減し、ヒューマンエラーを防ぐことができます!
ここでは、様々なツールを起点にアラビア語のファイルをOCRで読み取り、テキストデータを活用する自動化の具体例をテンプレートでご紹介します。
気になる内容があれば、ぜひクリックしてみてください!
<span class="mark-yellow">Gmailなどのメールツールで受信したアラビア語のファイルをトリガーにして、自動でOCR処理を実行しテキストを抽出する</span>ことができるので、メールで届く請求書や書類のデータ化を効率化できます。
<span class="mark-yellow">Googleフォームなどのフォームツールで受け付けたアラビア語のファイルを起点として、自動的にOCRでテキストを読み取る</span>ことで、申請書やアンケートなどのファイル提出があった際のデータ処理を迅速に行えます。
<span class="mark-yellow">Dropboxなどのオンラインストレージサービスにアラビア語のファイルがアップロードされたことをきっかけに、自動でOCR処理を起動し内容をテキスト化する</span>ことも可能で、大量の書類を保管しながら効率的にデータ化を進められます。
それではここから代表的な自動化例として、Gmailで特定のアラビア語ファイルが添付されたメールを受信した際に、OCR機能でファイルの内容を自動で読み取り、Notionのデータベースに記録するフローを解説していきます!
ここではYoomを使用してノーコードで設定をしていきます。
もしまだYoomのアカウントをお持ちでない場合は、こちらの登録フォームからアカウントを発行しておきましょう。
[Yoomとは]
今回は大きく分けて以下のプロセスで作成します。
ここでは、Yoomとそれぞれのアプリを連携して、操作が行えるようにしていきます。
まずは基本的な設定方法を解説しているナビをご覧ください!
それではここから今回のフローで使用するアプリのマイアプリ登録方法を解説します。
新規接続をクリックしたあと、アプリのメニュー一覧が表示されるのでGmailと検索し対象アプリをクリックしてください。
「Sign in with Google」をクリックします。
Googleアカウントの選択画面が表示されるので、連携したいアカウントをクリックしてください。
選択したGoogleアカウントでログイン確認画面が表示されるので、「次へ」をクリックします。
アクセス権限の確認画面が表示されるので、「続行」をクリックして連携を完了させましょう。
まず、事前準備として Notion上にデータベースを作成しておきましょう。
ここで作成したデータベースに、最後のステップでレコードが追加されます。
データベースはこのタイミングで作成しておかないと、後述するアクセス許可画面に表示されないため注意が必要です。
新規接続をクリックしたあと、アプリのメニュー一覧が表示されるのでNotionと検索し対象アプリをクリックしてください。
下記の画面が表示されるので、任意の方法でログインします。
今回はメールアドレスでログインするので、アドレス入力後「続行」をクリックします。
パスワードを入力し、「ログイン」をクリックします。
YoomからNotionへのアクセス権限を確認し、「ページを選択する」をクリックします。
Yoomがアクセスできるページを選択し、「アクセスを許可する」をクリックします。
(事前準備で作成したデータベースに必ずチェックを入れましょう。)
ここからいよいよフローの作成に入ります。
簡単に設定できるようテンプレートを用意しているので、まずはコピーします。
Yoomにログイン後、以下バナーの「試してみる」をクリックしてください。
テンプレートがコピーされると、以下のような画面が表示されますので、「OK」をクリックして設定を進めましょう。
「特定のラベルのメールを受信したら」をクリックします。
タイトルは任意で変更できます。
アプリとアクションはあらかじめ設定されているため、そのまま内容を確認してください。
Gmailと連携するアカウント情報に問題がなければ、「次へ」をクリックします。
事前準備として、Gmailで「特定ラベルのメール」を受信しておきましょう。
今回は「テスト用」というラベルを作成し、このラベルが付与されたメールの受信を自動化の起点としています。
また、後続のステップでOCR機能を使用して文字を読み取るため、アラビア語のファイルを添付しています。
Yoomの操作画面に戻り、トリガーの設定を行います。
指定した間隔でGmailをチェックし、トリガーとなるアクション(今回は特定ラベルのメールの受信)を検知すると、フローボットが自動で起動します。
トリガーの起動タイミングは、5分、10分、15分、30分、60分のいずれかで設定できます。
ご利用プランによって、設定できるトリガーの最短間隔が異なるため、その点は要チェックです。
なお、基本的にはそのプランの最短の起動間隔にしてお使いいただくことをおすすめします。
ラベル
入力欄をクリックすると、連携が有効になっているアカウントから候補が表示されます。
先ほどテスト用メールを受信した際に付与したラベルを、対象の項目として選択しましょう。
入力が完了したら、設定内容とトリガーの動作を確認するため「テスト」をクリックします。
テストに成功すると、Gmailで受信した特定ラベルのメールに関する情報が一覧で表示されます。
以下の画像の取得した値から添付ファイルのデータを利用し、この後のステップでOCR機能を用いて文字の読み取りを行います。
なお、添付ファイルのデータ以外にも、取得した値を活用することで件名や送信者などをNotionに転記することも可能です。
内容を確認し、「保存する」をクリックします。
「画像・PDFから文字を読み取る」をクリックします。
画像やPDFファイルから文字を読み取るアクションを設定します。
デフォルトで 「[v2] 任意のPDF・画像ファイル(4,000文字以内)から文字情報を読み取る(5タスク)」 が選択されていますので、そのまま使用します。
確認後、「次へ」をクリックします。
書類から文字情報を読み取る(OCR機能)では、AIモデルによってできること、できないことが異なります。
詳しい内容については、以下のヘルプページをご参照ください。
【注意事項】
ファイルの添付方法
トリガーのステップでGmailから取得した添付ファイルがデフォルトで設定されているため、そのまま使用します。
抽出したい項目
対象のテキストから抽出したい項目をカンマ区切りで入力してください。
今回はメールの添付ファイルからアラビア語の原文とその翻訳結果(日本語)を抽出し、Notionにレコードとして追加します。
そのため、デフォルトで設定されている項目をそのまま設定しています。
使用するAI、使用する言語
それぞれ注釈に沿って設定しましょう。
入力が完了したら、設定した項目が実際に正しく読み取りされるかどうかを確認するため「テスト」をクリックします。
OCRの設定について、詳しくは以下のヘルプページもご参照ください。
テストに成功すると、AIによって添付ファイルから読み取り・翻訳された情報が一覧で表示されます。
以下の画像の取得した値を使用して、Notionへレコードの追加が可能です。
内容を確認し、「保存する」をクリックします。
「レコードを追加する」をクリックします。
タイトルは任意で変更できます。
アプリとアクションはあらかじめ設定されているため、そのまま内容を確認してください。
Notionと連携するアカウント情報に問題がないか確認しましょう。
データベースID
入力欄をクリックすると連携が有効になっているアカウントから候補が表示されるので、マイアプリ連携時に作成したデータベースを選択し、「次へ」をクリックします。
データベースの連携がうまくいかない場合は、こちらのヘルプページをご確認ください。
追加するレコードの値
入力欄をクリックすると前のステップ(OCR機能で文字の読み取り)で取得した値が表示されるので、その中から対応する項目を各フィールドに割り当てましょう。
取得した値を活用することで、値が固定化されずに毎回最新の情報を反映できます。
なお、テキストを直接入力した部分は固定値とされるため、アウトプットを活用せず設定を行うと毎回同じ内容のレコードがNotionに追加されてしまうので注意が必要です。
入力が完了したら「テスト」をクリックして、設定した内容でNotionにレコードが追加されるか確認しましょう。
テストに成功すると、Notionに追加されたレコードの情報が表示されます。
あわせてNotionの画面を開き、指定した内容でレコードが実際に追加されているかを確認してみましょう。
今回は下記の通り追加されていました!
問題がなければYoomの操作画面に戻り、「保存する」をクリックします。
以上ですべての設定が完了しました!
設定が完了すると、画面上に以下のようなメニューが表示されます。
トリガーをONにすることで、Gmailでアラビア語ファイルを受信したタイミングで、自動的にOCR処理が実行されテキストが抽出されるようになります。
実際にアラビア語のファイルをメールで受信し、OCRによってテキストが正しく読み取られるかを確認してみましょう。
OCRを活用することで、紙や画像の情報をデジタルデータ化し、管理や共有を効率化できます。
YoomにはこうしたOCRを活用し業務を自動化できるテンプレートが多数用意されているので、ぜひご活用ください!
アラビア語のファイルをOCRで自動的にテキスト化することで、<span class="mark-yellow">これまで手作業で行っていたデータ入力の手間を削減し、転記ミスなどのヒューマンエラーを防ぐことができます。</span>
これにより、担当者は面倒な文字起こし作業から解放され、抽出したデータを分析・活用するといった、より付加価値の高い業務に集中できる環境が整います!
今回ご紹介したような業務自動化を実現できるノーコードツール「Yoom」を使えば、プログラミングの知識がない方でも、直感的な操作で簡単に業務フローを構築できます。
もし自動化に少しでも興味を持っていただけたなら、ぜひこちらから無料登録して、Yoomによる業務効率化を体験してみてください!
Q:読み取りと同時に翻訳も可能ですか?
A:はい、OCRによる読み取りの段階でも翻訳を同時に行うことができます。
今回の記事のように日本語へ翻訳したい場合は、抽出項目に「(Translate to Japanese)」と指示を入れるだけで、読み取りと翻訳が一度に実行されます。
ただしこれはOCR内で簡易的に行える方法であり、本格的な多言語対応や高精度な翻訳を求める場合は、専用の「翻訳」機能をご利用ください。
「翻訳」の設定方法はこちらをご確認ください。
Q:アラビア語OCRの読み取り精度は?
A:PDFや画像から高い精度で文字を抽出できますが、ファイルの内容や形式によって結果が変わります。
項目名が明確・値がユニーク・6500文字以内などの場合は高精度で抽出できますが、縦書きや複雑なレイアウト、大量の文字などは精度が下がってしまうことがあります。
詳しくはこちらのヘルプページをご参照ください。
Q:Notion以外に転記する方法はありますか?
A:はい、今回ご紹介したNotion以外にも、さまざまな活用が可能です。
例えば、OCRで読み取った請求書データをfreee会計やkintoneといった会計・業務システムに自動登録したり、内容をAIで要約してSlackやMicrosoft Teamsへ通知したりすることも可能です。
フローボットの基本的な操作方法については、こちらをご確認ください。