■概要
資料や記事などのPDFコンテンツを音声で確認したいと考えた際に、テキストを手作業でコピーし、音声合成ツールに入力する作業は手間がかかるものです。このワークフローを活用すれば、Google DriveにPDFファイルをアップロードするだけで、OCRがテキストを自動的に抽出し、ElevenLabsのtext to speech機能で音声ファイルへ変換、保存までの一連の流れを自動化できます。
■このテンプレートをおすすめする方
- 資料の確認や情報収集を、移動中などに耳で行い効率化したいと考えている方
- 動画コンテンツやポッドキャスト用のナレーション作成を効率化したいと考えている方
- ElevenLabsが提供する高品質なtext to speech機能を活用した業務自動化に興味がある方
■このテンプレートを使うメリット
- PDFをアップロードするだけで音声ファイルが自動生成されるため、テキストのコピー&ペーストやツールへの入力といった手作業の時間を削減できます。
- 手作業によるテキストのコピーミスや、音声合成ツールへの入力漏れといったヒューマンエラーを防ぎ、正確な音声ファイルを生成できます。
■フローボットの流れ
- はじめに、ElevenLabsとGoogle DriveをYoomに連携します。
- トリガーでGoogle Driveを選択し、「特定のフォルダ内に新しくファイル・フォルダが作成されたら」というアクションを設定します。
- 次に、オペレーションでGoogle Driveの「ファイルをダウンロードする」アクションを設定し、トリガーで検知したファイルをダウンロードします。
- 続いて、オペレーションでOCR機能の「OCRで文字を抽出」を選択し、ダウンロードしたPDFファイルからテキスト情報を抽出します。
- 次に、オペレーションでElevenLabsの「Convert Text to Speech」を設定し、抽出したテキストを音声に変換します。
- 最後に、オペレーションでGoogle Driveの「ファイルをアップロードする」を設定し、生成された音声ファイルを指定のフォルダにアップロードします。
※「トリガー」:フロー起動のきっかけとなるアクション、「オペレーション」:トリガー起動後、フロー内で処理を行うアクション
■このワークフローのカスタムポイント
- Google Driveのトリガー設定では、監視対象としたいフォルダを任意で指定してください。
- OCR機能では、PDFファイルから抽出したいテキストの項目を任意でカスタマイズできます。
- ElevenLabsのアクションでは、音声に変換するテキストの内容を、前段のOCR機能で取得した情報などを変数として設定できます。
- 最後のGoogle Driveへのファイルアップロード設定では、保存先のフォルダやファイル名を任意で設定することが可能です。
■注意事項
- Google Drive、ElevenLabsのそれぞれとYoomを連携してください。
- トリガーは5分、10分、15分、30分、60分の間隔で起動間隔を選択できます。
- プランによって最短の起動間隔が異なりますので、ご注意ください。
- ダウンロード可能なファイル容量は最大300MBまでです。アプリの仕様によっては300MB未満になる可能性があるので、ご注意ください。
- トリガー、各オペレーションでファイルを使用する際は、ファイルの容量制限についてをご参照ください。
- OCRまたは音声を文字起こしするAIオペレーションはチームプラン・サクセスプランでのみご利用いただける機能となっております。フリープラン・ミニプランの場合は設定しているフローボットのオペレーションはエラーとなりますので、ご注意ください。
- チームプランやサクセスプランなどの有料プランは、2週間の無料トライアルを行うことが可能です。無料トライアル中には制限対象のアプリやAI機能(オペレーション)を使用することができます。
- OCRデータは6,500文字以上のデータや文字が小さい場合などは読み取れない場合があるので、ご注意ください。