・
プログラミングの知識がなくても、自分専用のAIアプリが作れるDify。
研究者やエンジニアの間で、大量の論文を効率よく読み解く「論文要約」の仕組みを作成して取り入れているのを耳にしたことがある方もいるはず。
「AIツールって使えるらしいけど、そういうのに疎いからなあ」と、導入を足踏みしている方はもったいない!
今回は、Difyを使って論文要約を劇的に効率化する方法と上手なプロンプト設定のアイデアをご紹介します。
Dify活用のコツをつかんで、論文要約作業の効率化を目指していきましょう!
Difyで作った要約アプリはとても有用なのですが、毎回URLや論文本文をコピーして貼り付けるのは少し手間ですよね。
そこで役立つのが、ハイパーオートメーションツールのYoomです。
Yoomを使えば、「特定のフォームに論文をアップロードしたら、自動でAIが要約し、その結果をSlackで受け取りつつNotionに保存する」といった、一連の「流れ」を丸ごと自動化できます。
例えば、以下のようなテンプレートを使えば、今日からでもその便利さを体感できますよ。
■概要
「Microsoft SharePointにファイルが追加されたらOCRで読み取り、Difyで要約しSlackで送信する」フローは、文書管理とチームコミュニケーションを効率化する業務ワークフローです。
Microsoft SharePointに新しいファイルがアップロードされると、自動的にOCR機能で内容を読み取り、Difyを活用して要約します。
その後、要約内容をSlackに自動送信することで、チーム全体が素早く情報を共有できるようになります。
これにより、情報の取り扱いがスムーズになり、業務の生産性向上が期待できます。
■このテンプレートをおすすめする方
■このテンプレートを使うメリット
このフローを活用することで、Microsoft SharePointにファイル追加後、自動で要約がSlackに送信されるため、チーム全体が即座に内容を把握できます。
また、OCRとDifyの連携により、手作業での文書処理が不要になり、時間と労力を節約できます。
自動化されたプロセスにより、ヒューマンエラーのリスクを軽減し、信頼性の高い情報共有が可能です。
■概要
Googleフォームで論文やレポートを受け取る際、一つひとつファイルを開いて内容を確認し、関係者へ共有する作業は手間がかかるのではないでしょうか。
このワークフローを活用すれば、フォームへの回答送信をきっかけに、ファイル内のテキストをOCR機能で自動で読み取り、AIが要約した内容をSlackへ通知することが可能になります。
■このテンプレートをおすすめする方
■このテンプレートを使うメリット
■フローボットの流れ
※「トリガー」:フロー起動のきっかけとなるアクション、「オペレーション」:トリガー起動後、フロー内で処理を行うアクション
■このワークフローのカスタムポイント
■注意事項
Difyは、LLM(大規模言語モデル)を活用したワークフローをノーコードで構築できるプラットフォームです。
論文要約において特に優れているポイントが3つあります。
実際にどうやって構築するのか、簡単な流れを解説しますね。
1. テキスト取得ノードの設定:「TavilySearch」などの外部検索ツールをフローに組み込んで、Web上の論文を検索します。
2. プロンプトの作成:「あなたはプロの論文分析者です」や「この論点を〇〇分野の知識が浅い人でもわかりやすく〜」というように、役割や目的を明確にして指示を出します。
3. モデルの選択: 論文は非常に長いので、一度に読み込める量(コンテキスト)が多い「Gemini」や「Claude」を選ぶのがおすすめです。
Difyを使って、いくつかのパターンで論文要約の精度と利便性を試してみました。
まずは王道のパターンで検証を行ってみます。
Difyのエージェント機能でアプリを作成し、arXivに投稿されたばかりの英語論文(検証用のサンプル)をDifyに投入しました。
この際に『あなたは英語の学術論文を読み解き、日本語で分かりやすく構造化要約する専門アシスタントです。』という役割を与えます。
この【あなたは何をして、どんなものを受け取り、どのように処理するのか】という情報が、プロンプトを設定する上でかなり重要となるということを覚えておいてください。
アプリ公開後の操作結果は以下の通りです。
結果は約30秒ほどで出力されました!
専門用語がたっぷりの英語論文でしたが、わかりやすい日本語で翻訳され、かつ専門用語の解説も漏れなく記載されています。
論文対象となっている分野に疎い人でも、注釈があるおかげで理解しやすくなっているのが良いですね!
また、『専門用語は、元の英語も可能な範囲で併記してください(例:グラフニューラルネットワーク(Graph Neural Network; GNN))』とプロンプトに設定していたので、こちらも指示を忠実に反映しているようです。
一方で、記載内容の重複が幾つか見られます。
他にも、全体の文字数をカウントすると4000文字を超えたものになってしまっていたので、「要約になっているのか」ということを鑑みると疑問が残りますね...
初期の生成では、文脈や専門用語の解説は丁寧なものでしたが、内容がやや冗長なのが気になる結果となりました。
なお、追加投稿で【2000文字以内にまとめ直して】と指示すると、要点を抑えた文章が生成できたので、「ちょっと違うんだよなあ」と感じた際にはチャットを重ねるのが良い結果を得るコツといえるでしょう!