・
Alibaba Cloudが開発し、世界中で注目を集める大規模言語モデル「Qwen(クウェン)」。
特にQwenシリーズの上位モデルは、数学的推論やコーディング能力、画像認識を含むマルチモーダル性能において高い評価を受けています。
しかし、いかに高性能なエンジンを積んでいても、その操作方法を知らなければ真価は発揮できません。
AIに意図通りの回答を出してもらうために指示の出し方を工夫する技術の「プロンプトエンジニアリング」を施すことで、単なるチャットボットから専門家レベルのアシスタントへと進化します。
本記事では、公式ガイドに基づく正しいプロンプトの設計法から、実際にQwen Chatを利用してチャットと画像生成で検証した結果まで、実践的なテクニックを余すところなく解説します。
Qwenを使いこなすための第一歩は、モデルが最も理解しやすい「言葉の形式」を知ることです。
人間同士の会話と同じで、曖昧な指示よりも構造化された明確な指示の方が、AIに意図が伝わりやすくなります。
まずは、Qwen特有のフォーマットと、公式ガイドでも推奨されている3つの基本原則について解説します。
Qwenシリーズは、対話の構造を明確にするために「ChatML(Chat Markup Language)」と呼ばれるフォーマットを採用しています。
これは、誰が発言しているかを明確に区別するためのタグ付けルールです。
APIを利用する場合や、ローカル環境で生のテキストを扱う場合、プロンプトは以下のような特殊トークンで囲まれます。
例えば、APIにリクエストを送る際は、この構造を意識してメッセージリストを作成します。
このフォーマットを守ることで、Qwenは「今はシステムの設定を読んでいるんだな」「ここからがユーザーの質問だな」と文脈を正確に理解できるようになります。
特に、長い会話履歴を持つタスクや、複雑な役割を与えたい場合には、この基本構造の理解が不可欠です。
Alibaba Cloud Model Studioの公式ドキュメントでは、プロンプトの効果を最大化するために以下の3つの原則を掲げています。
これらはQwenに限らず多くのLLMに共通する重要な指針ですが、特にQwenにおいては出力精度に直結します。
テキストチャットにおいて、Qwenの論理的思考能力や推論能力を最大限に引き出すためのテクニックを紹介します。
単に質問に答えてもらうだけでなく、複雑な問題を解かせたり、外部ツールを使わせたりする場合に役立つ実践的な手法です。
システムプロンプトは、AIの振る舞いを決定づける最も重要な部分です。
ここでは、役割の定義だけでなく、出力形式の指定や禁止事項(制約)を含めることが推奨されます。
特に重要なのが「言語指定」です。
Qwenは多言語対応ですが、学習データの割合から英語や中国語が優位になることがあります。
日本語で高品質な回答を得たい場合は、システムプロンプト内で「あなたは日本語のアシスタントです。すべての回答を自然な日本語で行ってください」と明示的に制約をかけることで、出力の安定性が向上します。
【推奨される構成】
複雑な推論を必要とするタスク(数学の問題、論理パズル、プログラミングのデバッグなど)では、「CoT(思考の連鎖)」と呼ばれるテクニックが効果を発揮します。
これは、いきなり答えを出させるのではなく、「ステップバイステップで考えてください(Let's think step by step)」というマジックワードをプロンプトに追加し、思考プロセスを順を追って出力させる手法です。
Qwenに対しては、「まず問題を分析し、次に解決策を検討し、最後に結論を述べてください」といった具体的な手順を示すことも有効です。
途中経過を出力させることで、論理の飛躍を防ぎ、正答率を高めることができます。
Qwenは、外部のツール(APIや関数)を呼び出してタスクを実行する「Function Calling」に対応しています。
これを生のテキストプロンプトで実現する場合、利用可能なツールをJSONスキーマとして定義し、システムプロンプトに埋め込む必要があります。
具体的には、<tools> というタグの中にツールの定義(名前、説明、パラメータ)を記述し、「ツールを使用する必要がある場合は、<tool_call> タグ内にJSONを出力してください」と指示します。
これにより、Qwenはユーザーの質問に応じて「この質問には天気予報APIを使う必要がある」と判断し、適切なJSONデータを生成して返してくれます。
これをアプリケーション側で受け取り、実際のAPIを実行する仕組みです。
高度なプロンプトエンジニアリングを習得しても、毎回手動でチャット画面に入力していては業務効率は上がりません。
Yoomを使えば、作成したプロンプトをワークフローに組み込み、日々の業務を自動化できます。
例えば、QwenなどのAIで生成した記事をNotionに自動保存したり、AIで作成した画像を自動で管理ツールにアップロードしたりすることが可能です。
■概要
Googleフォームで集めたアンケート回答や日報などの文章を、手作業でコピーして整形し、別のツールに転記する作業に手間を感じていませんか。この一連の作業は時間がかかるだけでなく、転記ミスや修正漏れといったヒューマンエラーの原因にもなり得ます。このワークフローを活用すれば、Googleフォームへの回答送信をきっかけに、AIが自動で文章を校正し、その結果をNotionへ格納するため、こうした課題を円滑に解消します。
■このテンプレートをおすすめする方
■このテンプレートを使うメリット
■フローボットの流れ
※「トリガー」:フロー起動のきっかけとなるアクション、「オペレーション」:トリガー起動後、フロー内で処理を行うアクション
■このワークフローのカスタムポイント
■注意事項
Qwenシリーズには、画像を生成できるQwen-Imageモデルと、画像を理解する能力を持つQwen-VLモデルも存在します。
マルチモーダルなタスクにおいて、プロンプトをどのように工夫すれば意図通りの画像生成や認識ができるのか、そのコツを解説します。
Qwen Chatの画像生成機能(Qwen-Image)では、プロンプトの「語順」と「構造」が品質を左右します。
漫然と単語を並べるのではなく、以下の順序で情報を記述することが推奨されています。
【推奨フォーマット】
「被写体」→「環境・背景」→「スタイル・画風」→「品質タグ」
例えば、「猫」を描かせたい場合、「猫」とだけ書くのではなく、「ソファで眠る三毛猫(被写体)、日差しが差し込むリビングルーム(環境)、水彩画風、柔らかいタッチ(スタイル)、高解像度、詳細なテクスチャ(品質)」のように段階的に記述します。
また、上記のように単語を羅列する方法もありますが、Qwenの場合は自然言語(文章形式)での記述が適している場合が多いです。
「〜のようなスタイルで描いてください」と文章で指示することで、文脈を汲み取った豊かな画像が生成されやすくなります。
Qwen-VLモデルに対して画像の内容を質問したり、OCR(文字認識)を行わせたりする場合、画像をプロンプトの一部として埋め込む必要があります。
ブラウザ版のQwen Chatで利用する際は、入力欄のメニューから画像を添付します。
API利用時は、テキストベースのプロンプトの中に<|image|>という特殊トークンを配置し、その前後に質問を記述します。
例えば、「この画像に写っている看板の文字を読み取ってください」という指示の場合、「User: <|image|> この画像内の看板に書かれているテキストをすべて抽出して出力してください。」のように記述します。
また、画像内の特定の位置を指定したい場合は、座標(バウンディングボックス)を用いた指示も可能です。
画像認識においても、チャットと同様に「具体的に何を読み取るべきか」「出力形式はどうするか(JSONや表形式など)」を明確に指示することが、高精度な認識結果を得る鍵となります。
ここでは実際に、プロンプトエンジニアリングのテクニックを使う場合と使わない場合で、Qwenの出力がどのように変化するかを検証します。
「チャットによる論理推論」と「画像生成」の2つのパターンで比較を行います。
ある架空のSaaS製品の導入メリットを、特定のターゲット層に向けて解説させるタスクで検証します。
【検証プロンプト:プロンプトエンジニアリングなし】
クラウド会計ソフトのメリットを教えて。
【検証プロンプト:プロンプトエンジニアリングあり】
あなたはIT導入コンサルタントです。
従業員数50名規模の製造業の経営者に向けて、クラウド会計ソフトを導入するメリットを3つ解説してください。
以下の制約事項を守ってください:出力はMarkdown形式で行ってください。
- 専門用語には簡単な解説を加えること
- 導入前と導入後の変化を比較する表を作成すること
- 経営者が気にする「コスト削減」と「業務効率化」の観点を盛り込むこと
それぞれのプロンプトで生成された結果は、以下の通りです。
【プロンプトエンジニアリングなし】
【プロンプトエンジニアリングあり】
生成された結果から、以下のことがわかりました。
プロンプトエンジニアリングを使わなくても一般的なメリットは網羅されるため、特定のテーマについて広く浅く知りたい場合には十分役立ちます。
しかし、Qwenの強みを最大限に活かすなら、やはりプロンプトエンジニアリングの活用が不可欠です。
今回のようにターゲットや出力形式(表形式など)を明確に指定することで、情報の視認性が高まり、実務ですぐに使えるレベルの回答を効率よく引き出せます。
ただし、注意点もあります。
プロンプトは具体的であるほど回答の精度が上がりますが、条件を絞り込みすぎると、本来知るべきだった周辺情報が漏れてしまうリスクがあります。
また、プロンプトエンジニアリングを使うと参考資料のリンクが省略されやすくなる傾向が見られました。
そのため、業務でファクトチェックを行う前提であれば、「参考にした情報の出典リンクを出力してください」といった指示をプロンプトに付け加えるのがおすすめです。
続いて、「未来の都市」をテーマに画像を生成させる指示で検証します。
【検証プロンプト:プロンプトエンジニアリングなし】
未来の都市
【検証プロンプト:プロンプトエンジニアリングあり】
西暦2300年の未来都市を描いてください。
中心には巨大なホログラムの広告塔があり、空飛ぶ車が行き交っています。
背景は快晴で、太陽光が真上から差しています。
画風はフォトリアルで、4K解像度、高精細なディテール、物理法則に沿ったライティングを意識してください。
それぞれのプロンプトで生成された画像は、以下の通りです。
【プロンプトエンジニアリングなし】
【プロンプトエンジニアリングあり】
生成された画像から、以下のことがわかりました。
画像生成において、「どのような画像がほしいか」が明確に決まっている場合は、プロンプトエンジニアリングを使わない手はありません。
被写体や背景、画風などを細かく指定することで、Qwenは近景から遠景まで統一感のある、写真のようにリアルで高品質な画像を生成してくれます。
単なる短いプロンプトだけでは、AIの解釈に依存する部分が大きくなり、SF風の要素が混ざったり、ゲームグラフィックのような不自然さが残ったりすることが確認できました。
また、画像内に表示される文字も崩れていました。
一方で、毎回長文のプロンプトを構築するには手間もかかります。
「大まかなイメージさえ伝われば十分」というケースや、そこまで詳細なクオリティが求められない場面では、あえて簡潔な指示にとどめるのも賢い使い方と言えます。
用途や目的、かけられる時間に応じて、プロンプトの具体性を柔軟にコントロールすることが、Qwenの画像生成を業務で使いこなすためのポイントです。
プロンプトエンジニアリングをマスターしたら、次はQwenを単体で使うだけでなく、システム全体の一部として活用するステップへ進みましょう。
ここでは、より高度な活用方法を2つ紹介します。
Qwenの強みである「テキスト」と「画像」の両方を理解できる能力を活かし、マルチモーダルエージェントとして稼働させることができます。
例えば、WebサイトのスクリーンショットをQwenに渡し、「この画面のデザインをもとに、HTMLとCSSのコードを生成して」と指示すれば、フロントエンド開発の補助ツールとして機能します。
また、手書きのメモやホワイトボードの写真を読み込ませて、「この内容を整理してToDoリスト化し、優先順位をつけて」と指示することも可能です。
視覚情報と論理推論を組み合わせることで、対応できる業務の幅が広がります。
Qwenは非常に賢いモデルですが、学習データに含まれていない最新の情報や、社内の非公開データについては答えられません。
これを補うのが「RAG(Retrieval-Augmented Generation)」という技術です。
社内ドキュメントや最新のニュース記事を検索し、その結果をQwenへのプロンプトに「参考情報」として動的に挿入します。
この際、「以下の参考情報のみに基づいて回答してください」という制約プロンプトを加えることが重要です。
これにより、Qwenの言語能力を活かしつつ、事実に基づいた正確な回答を生成させることができます。
Qwenは、世界トップレベルの性能を持つAIモデルですが、その真価を引き出す鍵は「プロンプトエンジニアリング」にあります。
ChatMLフォーマットを理解し、「明確さ」「役割設定」「構造化」の3原則を守るだけで、アウトプットの質は向上します。
また、チャットだけでなく画像生成においても、具体的な指示と構造化が成功の秘訣であると検証を通じて確認しました。
まずは、本記事で紹介したテクニックを1つずつ試し、あなたの業務における「最強のアシスタント」を育ててみてください。
Yoomを利用すれば、Qwenなどの高度な生成AIをノーコードで業務システムと連携させることができます。
AIが生成した成果物を、自動的に次の工程へと受け渡すことで、シームレスな業務フローを実現します。
例えば、以下のような業務の自動化が可能です。
■概要
受信したメールに対する返信案をChatGPTを使用して作成し、指定のSlackチャンネルに通知します。
■設定方法
1.SlackとChatGPTを連携します。(マイアプリ連携)
2.メールトリガーでフローボットを起動させる条件を設定してください。
3.ChatGPTのオペレーションで、連携アカウントや返信案作成の設定を行ってください。
4.Slackの「チャンネルにメッセージを送る」オペレーションで連携アカウント、通知先のチャンネル、通知メッセージの設定を行います。
5.メールトリガーを設定したメールアドレス宛にトリガー条件を満たしたメールが届くと、フローボットが起動します。
■注意事項
・ChatGPTとSlackそれぞれでアカウントとの連携設定が必要です。
・Slackの通知先チャンネルIDやChatGPTへの指示内容を適切な値に置き換えてください。
【出典】
Prompt Engineering、プロンプト - Alibaba Cloud Model Studio/Qwen/Hugging Face-Qwen