自己修正と検証パターン

🔄 Quick Recall: 前回のレッスンで、問題を分解しチェーンで処理する方法を学んだ。しかしチェーンのあるステップが欠陥のある出力を生んだら？自己修正がなければ、初期のエラーがチェーン全体に伝播し、自信に満ちた誤りを生む。

自信のパラドックス

AIには魅力的な欠陥がある。不確かな結論も確かな結論と同じ自信で提示する。自然に「ここは自信がない」「この推論には弱点がある」とはフラグを立てない。

修正メカニズムをシステムに組み込まなければ、エラー検出の負担はすべてあなたにかかる。

パターン1：生成→検証

創造と批評を分離する最もシンプルな自己修正パターン。

ステップ1——生成：

「[問題]を分析し、評価を提示して。品質に集中——自己検閲やヘッジをしないこと。」

ステップ2——検証：

「今生成した分析を批判的に検討して。以下を確認：
事実の正確性——すべての主張は正確か？前提に依存する主張にフラグ。
論理的整合性——推論は成立するか？論理の飛躍はないか？
完全性——見落とされた重要な考慮事項はないか？
バイアスチェック——分析が特定の視点を不当に有利にしていないか？
確信度評価——各主要結論の確信度（高・中・低）を付けて理由を説明。
発見した問題に対処した修正版を作成して。」

ライターにエディターが必要な理由と同じ。創造する脳と評価する脳は異なる思考モード。

✅ Quick Check: 今すぐ試してみよう。AIに何かを分析させ、別のメッセージで自身の分析を批評させる。AIが自分で何を見つけるか驚くはず。

パターン2：悪魔の代弁者

AIに自身の結論の反対を論じさせる。

ステップ1——初期分析：

「[決定/戦略/主張]が良いアイデアかを分析して。最も強い賛成論を展開すること。」

ステップ2——悪魔の代弁者：

「今度は反対の立場を取って。前の分析のすべてに反対する優秀な批評家として、この結論に対する最も強い反論を展開して。すべての弱点、疑わしい前提、潜在的な失敗モードを見つけて。遠慮なく。」

ステップ3——統合：

「中立的な評価者として一歩引いて。賛成論と反対論の両方を見た上で：
悪魔の代弁者の議論のうち、実際に元の分析を弱体化させるものはどれか？
正当だが根本的結論を変えない批判はどれか？
最も強い反論に対処するため、元の推奨のどこを修正すべきか？
この精査を生き残った最終評価を作成して。」

統合された結論は、1回パスの分析とは次元の異なるニュアンスを持つ。

パターン3：確信度キャリブレーション

AIに不確実性を定量化させる。

分析出力の後に追加：

「分析の各主要結論に確信度を付け、根拠を説明して：
高確信度（85%以上）： 確立された原則または明確なエビデンスに基づく 中確信度（50-84%）： 合理的な推論に基づくが、顕著な不確実性がある 低確信度（50%未満）： 限られたエビデンス、重大な前提、または外挿に基づく
低確信度の項目には明示的に述べること：
この主張が正しいために何が真でなければならないか
どんな追加情報で確信度が上がるか
この主張が間違っていた場合のリスク」

「市場規模は200億円」とだけ言うより、「確信度：低（40%）。根拠：米国市場データからの人口調整による外挿」と言うほうが遥かに有用。

パターン4：自己修復シーケンス

品質問題のある出力を体系的に診断・修正する。

ステップ1——問題の特定：

「以下の出力に品質問題がある。何が問題かを診断して。具体的に：問題は何か？推論のどこで崩れているか？原因は何か？」

ステップ2——修正の設計：

「診断に基づき、この出力を修正するための具体的な変更点は？何を追加し、何を修正し、どんな構造変更が必要か？まだ変更は加えないで——修正計画だけ。」

ステップ3——修正の実行：

「修正計画を実行して。元の出力の修正版を、特定したすべての修正を反映して作成。何が変わったか、なぜ変わったかを明示して。」

「直して」と言うより、3ステップ（診断→計画→修正）のほうが良い結果を出す。問題を理解してから解決を試みるため。

パターン5：マルチパスリファインメント

重要な出力には、異なるレンズで複数の検証パスを実行する。

レンズ1——正確性： 事実の正確性を確認。すべての主張、数値、参照をチェック。

レンズ2——論理性： 論理的厳密性を確認。すべての推論、結論、因果主張の妥当性。

レンズ3——完全性： 完全性を確認。欠落した視点、反論、シナリオはないか。

統合： 3つのレビューの指摘をすべて反映した最終版を作成。

いつ自己修正を使うか／使わないか

使う場面：

複雑で分析的なタスク（戦略、リサーチ、技術設計）
エラーのコストが高い（財務分析、法的レビュー、医療情報）
出力が人間のレビューなしに直接使われる
信頼性がスピードより重要

使わない場面：

単純で事実に基づくタスク（テキストのフォーマット、簡単な計算）
エラーのコストが低い（ブレインストーミング、カジュアルな文章）
自分でレビューする予定の出力（編集前提のドラフト）
スピードが完璧さより重要

Key Takeaways

生成→検証が創造と批評を分離し、1パス生成が見逃すエラーを捕捉する
悪魔の代弁者が反対論を展開して結論をストレステストする
確信度キャリブレーションで「AIがXと言った」が「AIはXに40%の確信」に変わる
自己修復シーケンスは問題を診断してから修正し、より良い結果を出す
自己修正にはオーバーヘッドがある——複雑で重要なタスクに使う

Up Next

レッスン5：メタプロンプティングと再帰的改善——AIにプロンプトを改善させ、推論プロセスを最適化させ、出力を再帰的に向上させる手法を学ぶ。