・
「データ分析が重要なのはわかっているけれど、専門スキルがないから難しい……」
このように感じていませんか?
これまで、データ分析を行うためにはExcelの複雑な関数や、Python、SQLといったプログラミング言語の習得が必要不可欠でした。
しかし、生成AIの登場により、その常識は大きく変わりつつあります。今や、自然言語(日本語)で指示を出すだけで、誰でも高度なデータ分析が可能になる「データ分析の民主化」が進んでいます。
そこで本記事では、生成AIを活用したデータ分析の概要から、初心者におすすめのツール比較、そして実際に分析を行う手順までをわかりやすく解説します。
生成AIを活用したデータ分析とは、ChatGPTやClaudeなどのAIに対して、日常会話と同じ言葉(自然言語)で指示を出すだけで、データの整形・集計・分析・可視化・示唆出しを行う手法のことです。
従来の手法と比較すると、上記のような違いがあります。
最大の特徴は、専門家でなくてもデータに基づいた意思決定が可能になる点です。「来月の売上を予測して」「このグラフから何が言える?」といった問いかけに対し、AIが答えを返してくれます。
現在、データ分析において特に優れた機能を持つ3つの主要AIモデルを紹介します。それぞれの特徴を理解し、目的にあわせて使い分けるのがおすすめです。
🗣️特徴
「Artifacts」というプレビュー機能が強力です。AIが作成したグラフやコードを別ウィンドウで確認でき、インタラクティブに編集することが可能です。また、生成されるコードの品質が高いため、エンジニアや分析プロセスを確認しながら進めたい人に適しています。
🗣️おすすめ
分析結果をダッシュボードのように見せたい場合や、Pythonコード自体も成果物として欲しい場合に最適です。
🗣️特徴
Googleのエコシステムとの連携が強みです。Googleドライブやスプレッドシート内のデータを直接読み込んで分析できるため、ファイルのアップロードの手間が省けます。また、非常に長いコンテキスト(情報量)を処理できるため、大量のドキュメントや大規模なデータセットの分析に向いています。
🗣️おすすめ
普段から業務でGoogle Workspaceを利用している企業や、複数のファイルを横断して分析したい場合に力を発揮します。
データ分析を行う際、最も時間がかかるのはデータの収集や加工(前処理)だといわれています。分析の前段階で疲弊してしまっては本末転倒です。
しかし、Yoomを活用すれば、散らばったデータを自動で集約し、AIが分析しやすい形に整えることができます。
例えば、以下のようなフローを自動化することで、分析業務を効率化できます。
アンケート結果をGoogleフォームで収集し、その内容をChatGPTなどの生成AIで自動的に要約・分析を行い、Googleスプレッドシートに整理して蓄積するフローです。これにより、定性データの分析準備がスムーズに完了します。
■概要
フォームから送信されたお問い合わせやアンケートの回答を手作業で要約し、管理用のGoogle スプレッドシートに転記する作業に時間を要していませんか。このワークフローは、フォームが送信されると、その内容をChatGPTが自動で要約し、指定のGoogle スプレッドシートにレコードとして追加します。Google スプレッドシートとChatGPTを連携させることで、これまで手動で行っていた一連の作業を自動化し、入力漏れや転記ミスを防ぎながら、情報管理を効率化できます。
■このテンプレートをおすすめする方
■このテンプレートを使うメリット
■フローボットの流れ
■このワークフローのカスタムポイント
※「トリガー」:フロー起動のきっかけとなるアクション、「オペレーション」:トリガー起動後、フロー内で処理を行うアクション
■注意事項
毎日決まった時間にSalesforceから最新の売上データを取得し、前日比などを計算したうえでSlackやChatworkに自動通知するフローです。リアルタイムな数値把握が可能になり、次のアクションへの判断スピードが向上します。
■概要
毎日Salesforceのレポートを取得して、自動的にChatworkに通知するフローです。
■このテンプレートをおすすめする方
1.営業チームのパフォーマンスを迅速に把握したい方
2.Salesforceのレポートを日常的に利用している方
3.Chatworkを日常的に活用している方
■このテンプレートを使うメリット
・最新のデータをもとに迅速に意思決定が行えるため、チームのパフォーマンスが向上します。
・手動でレポートを取得して共有する手間が省けるため、業務効率が向上します。
ここからは、実際に生成AI(ChatGPT)を使ってデータ分析を行う流れを実演形式で紹介します。
今回は「架空の店舗売上データ(CSVファイル)」を使って、来月の販売戦略を立案するシナリオで進めていきます。
まずは、分析したいデータの中身をAIに理解させ、不備がないか確認します。
※架空の店舗売上データには、あえて売上金額の欠損値(空欄)と表記揺れ(ガジェットとガジェット)を仕込んでいます。
【プロンプト】
以下の手順で、アップロードしたデータを分析してください。
1. データ構造の確認: 行数、カラムの意味、欠損値の有無を特定してください。
2. データの不備の特定と修正:
・欠損値がないか確認し、あれば適切な方法で補完するか報告してください。
・「商品カテゴリ」などの列に、表記ゆれがないか確認し、統一してください。
・数値データが文字列として認識されていないか確認し、必要に応じて型変換を行ってください。
3. 要約統計量の表示:修正後のデータに基づき、売上金額や客数の平均・最大・最小などの基本統計量を出力してください。
【出力結果(ChatGPT 5.2 Thinking)】
欠損(空欄)があった売上金額に対し、AIはデータ全体の分布から外れ値の影響を抑えるために中央値(980,000円)を採用して補完しました。人間が手作業で行うと面倒な表記揺れも、AIは同一カテゴリとして自動認識しています。
次に、データの傾向を視覚的に把握します。
【プロンプト】
クレンジングしたデータを使用して、可視化してください。
1. 月別の売上推移(棒グラフ):月ごとの売上合計の推移を棒グラフで作成してください。
2. 商品カテゴリ別の売上構成比(円グラフ):全期間を通じた商品カテゴリ別の売上シェアを可視化してください。
3. グラフからの考察(インサイト):作成したグラフから読み取れる「売上の特徴」や「注目すべき傾向」を3点ほど箇条書きで解説してください。
※グラフ内の日本語が文字化けしないよう、適切なフォント設定を適用してください。
【出力結果(ChatGPT 5.2)】