データジャーナリズム
AIで生データからストーリーを発掘する——データセット分析、パターン発見、ビジュアライゼーションで複雑な情報を読者に届ける方法。
🔄 Quick Recall: 前のレッスンでAIを執筆・編集パートナーとして使う方法を学んだ。もう1つの強力な能力を加える——手動分析なら何週間もかかるデータセットからストーリーを発掘するAI活用。
データはどこにでもある。ストーリーは隠れている
政府機関は何千ものデータセットを公開している——予算、犯罪統計、環境報告、検査記録。企業は四半期報告書で財務の詳細を開示。NPOは成果データを公開。国勢調査はすべてのコミュニティの人口統計を描く。
これらのデータの大半は報道されない。面白くないからではなく、分析に時間と専門知識が必要で多くの報道機関がリソースを割けないから。AIはその方程式を変える。スプレッドシートの中のストーリーを見つけるのに、データサイエンティストである必要はない。
データをAIに読み込ませる
以下のデータセットを分析して:
[CSV/テーブルを貼り付け or ファイルをアップロード]
1. 最も重要な3つのトレンドを平易な言葉で説明
2. 外れ値や異常値を特定(記事になる可能性)
3. データから浮かぶ疑問を5つ挙げる
4. データの品質評価(欠損値、不整合など)
5. このデータを記事にする場合のリード案を2つ
パターンの検証
AIが「パターンがある」と言ったら、記者は3つを確認する:
1. データは正確か?
- 欠損値やエラーはないか
- 計測方法は一貫しているか
- 異なる時期のデータを比較していないか
2. パターンは統計的に有意か?
- 相関と因果を混同していないか
- サンプルサイズは十分か
- 期間を変えてもパターンは維持されるか
3. 原因は何か?
- パターンの背後にある「なぜ」は何か
- 専門家はどう説明するか
- 当事者に話を聞いたか
日本のデータジャーナリズム
| データ源 | 内容 | 記事テーマ例 |
|---|---|---|
| e-Stat | 政府統計ポータル | 人口動態、産業動向、労働市場 |
| EDINET | 有価証券報告書 | 企業の財務分析、役員報酬 |
| 情報公開制度 | 行政文書 | 公共支出、政策決定過程 |
| 選挙管理委員会 | 選挙資金報告書 | 政治資金の流れ |
| 国土地理院 | 地理空間データ | 防災、都市開発 |
ビジュアライゼーションの指示
以下のデータに最適なビジュアライゼーションを提案して:
データの内容:[概要]
読者に伝えたいポイント:[メインメッセージ]
掲載先:[Web/紙面/SNS]
1. 最適なチャートの種類と理由
2. 軸のラベルとタイトルの提案
3. ハイライトすべきデータポイント
4. 読者が誤解しないための注意点
✅ Quick Check: AIが「過去5年間でXが200%増加」と見つけた。記事にする前に何を確認する? 1)絶対数——2件が6件になっても200%増。2)期間設定——なぜ5年? 3年なら結論が変わるか。3)原因——増加は何によるものか。
エクササイズ:データからストーリーを探す
- e-Statまたは公開データから自分の担当分野のデータセットを1つ取得
- AIにトレンドと異常値を分析させる
- 最も面白い発見を1つ選び、別のソースで検証
- 記事のリード案をAIに2つ生成させる
- 「記事にするために何を追加取材すべきか」をリスト化
Key Takeaways
- AIはコーディングなしでデータ分析を可能にする——自然言語でデータに質問できる
- パターンの発見は出発点。データ品質の確認、統計的有意性の検証、原因の調査が必須
- 方法論の透明性(データ出典、分析方法、制約)はデータジャーナリズムの信頼性の基盤
- 日本にはe-Stat、EDINET、情報公開制度など豊富な公開データ源がある
- データセットの相関はリード(手がかり)であって記事ではない——取材が記事にする
次のレッスン: ここまでのスキルを倫理の観点から再検証する——バイアス、開示、AIの「支援」と「執筆」の境界線。
理解度チェック
まず上のクイズを完了してください
レッスン完了!