レッスン 5 15分

データジャーナリズム

AIで生データからストーリーを発掘する——データセット分析、パターン発見、ビジュアライゼーションで複雑な情報を読者に届ける方法。

🔄 Quick Recall: 前のレッスンでAIを執筆・編集パートナーとして使う方法を学んだ。もう1つの強力な能力を加える——手動分析なら何週間もかかるデータセットからストーリーを発掘するAI活用。

データはどこにでもある。ストーリーは隠れている

政府機関は何千ものデータセットを公開している——予算、犯罪統計、環境報告、検査記録。企業は四半期報告書で財務の詳細を開示。NPOは成果データを公開。国勢調査はすべてのコミュニティの人口統計を描く。

これらのデータの大半は報道されない。面白くないからではなく、分析に時間と専門知識が必要で多くの報道機関がリソースを割けないから。AIはその方程式を変える。スプレッドシートの中のストーリーを見つけるのに、データサイエンティストである必要はない。

データをAIに読み込ませる

以下のデータセットを分析して:

[CSV/テーブルを貼り付け or ファイルをアップロード]

1. 最も重要な3つのトレンドを平易な言葉で説明
2. 外れ値や異常値を特定(記事になる可能性)
3. データから浮かぶ疑問を5つ挙げる
4. データの品質評価(欠損値、不整合など)
5. このデータを記事にする場合のリード案を2つ

パターンの検証

AIが「パターンがある」と言ったら、記者は3つを確認する:

1. データは正確か?

  • 欠損値やエラーはないか
  • 計測方法は一貫しているか
  • 異なる時期のデータを比較していないか

2. パターンは統計的に有意か?

  • 相関と因果を混同していないか
  • サンプルサイズは十分か
  • 期間を変えてもパターンは維持されるか

3. 原因は何か?

  • パターンの背後にある「なぜ」は何か
  • 専門家はどう説明するか
  • 当事者に話を聞いたか

日本のデータジャーナリズム

データ源内容記事テーマ例
e-Stat政府統計ポータル人口動態、産業動向、労働市場
EDINET有価証券報告書企業の財務分析、役員報酬
情報公開制度行政文書公共支出、政策決定過程
選挙管理委員会選挙資金報告書政治資金の流れ
国土地理院地理空間データ防災、都市開発

ビジュアライゼーションの指示

以下のデータに最適なビジュアライゼーションを提案して:

データの内容:[概要]
読者に伝えたいポイント:[メインメッセージ]
掲載先:[Web/紙面/SNS]

1. 最適なチャートの種類と理由
2. 軸のラベルとタイトルの提案
3. ハイライトすべきデータポイント
4. 読者が誤解しないための注意点

Quick Check: AIが「過去5年間でXが200%増加」と見つけた。記事にする前に何を確認する? 1)絶対数——2件が6件になっても200%増。2)期間設定——なぜ5年? 3年なら結論が変わるか。3)原因——増加は何によるものか。

エクササイズ:データからストーリーを探す

  1. e-Statまたは公開データから自分の担当分野のデータセットを1つ取得
  2. AIにトレンドと異常値を分析させる
  3. 最も面白い発見を1つ選び、別のソースで検証
  4. 記事のリード案をAIに2つ生成させる
  5. 「記事にするために何を追加取材すべきか」をリスト化

Key Takeaways

  • AIはコーディングなしでデータ分析を可能にする——自然言語でデータに質問できる
  • パターンの発見は出発点。データ品質の確認、統計的有意性の検証、原因の調査が必須
  • 方法論の透明性(データ出典、分析方法、制約)はデータジャーナリズムの信頼性の基盤
  • 日本にはe-Stat、EDINET、情報公開制度など豊富な公開データ源がある
  • データセットの相関はリード(手がかり)であって記事ではない——取材が記事にする

次のレッスン: ここまでのスキルを倫理の観点から再検証する——バイアス、開示、AIの「支援」と「執筆」の境界線。

理解度チェック

1. AIがデータセットで「有意なパターン」を発見した場合、最初にすべきことは?

2. コーディング経験のない記者がAIをデータ分析にどう使える?

3. データ駆動型記事を出稿する際、常に含めるべきものは?

すべての問題に答えてから確認できます

まず上のクイズを完了してください

関連スキル