自己修正と検証パターン
AIに自身のエラーを検出・診断・修正させるパターンを実装し、脆い出力を信頼できる結果に変える。
プレミアムコースコンテンツ
このレッスンはプレミアムコースの一部です。Proにアップグレードすると、すべてのプレミアムコースとコンテンツを利用できます。
- すべてのプレミアムコースを利用
- 1,000以上のAIスキルテンプレート付き
- 毎週新しいコンテンツを追加
🔄 Quick Recall: 前回のレッスンで、問題を分解しチェーンで処理する方法を学んだ。しかしチェーンのあるステップが欠陥のある出力を生んだら?自己修正がなければ、初期のエラーがチェーン全体に伝播し、自信に満ちた誤りを生む。
自信のパラドックス
AIには魅力的な欠陥がある。不確かな結論も確かな結論と同じ自信で提示する。自然に「ここは自信がない」「この推論には弱点がある」とはフラグを立てない。
修正メカニズムをシステムに組み込まなければ、エラー検出の負担はすべてあなたにかかる。
パターン1:生成→検証
創造と批評を分離する最もシンプルな自己修正パターン。
ステップ1——生成:
「[問題]を分析し、評価を提示して。品質に集中——自己検閲やヘッジをしないこと。」
ステップ2——検証:
「今生成した分析を批判的に検討して。以下を確認:
- 事実の正確性——すべての主張は正確か?前提に依存する主張にフラグ。
- 論理的整合性——推論は成立するか?論理の飛躍はないか?
- 完全性——見落とされた重要な考慮事項はないか?
- バイアスチェック——分析が特定の視点を不当に有利にしていないか?
- 確信度評価——各主要結論の確信度(高・中・低)を付けて理由を説明。
発見した問題に対処した修正版を作成して。」
ライターにエディターが必要な理由と同じ。創造する脳と評価する脳は異なる思考モード。
✅ Quick Check: 今すぐ試してみよう。AIに何かを分析させ、別のメッセージで自身の分析を批評させる。AIが自分で何を見つけるか驚くはず。
パターン2:悪魔の代弁者
AIに自身の結論の反対を論じさせる。
ステップ1——初期分析:
「[決定/戦略/主張]が良いアイデアかを分析して。最も強い賛成論を展開すること。」
ステップ2——悪魔の代弁者:
「今度は反対の立場を取って。前の分析のすべてに反対する優秀な批評家として、この結論に対する最も強い反論を展開して。すべての弱点、疑わしい前提、潜在的な失敗モードを見つけて。遠慮なく。」
ステップ3——統合:
「中立的な評価者として一歩引いて。賛成論と反対論の両方を見た上で:
- 悪魔の代弁者の議論のうち、実際に元の分析を弱体化させるものはどれか?
- 正当だが根本的結論を変えない批判はどれか?
- 最も強い反論に対処するため、元の推奨のどこを修正すべきか?
この精査を生き残った最終評価を作成して。」
統合された結論は、1回パスの分析とは次元の異なるニュアンスを持つ。
パターン3:確信度キャリブレーション
AIに不確実性を定量化させる。
分析出力の後に追加:
「分析の各主要結論に確信度を付け、根拠を説明して:
高確信度(85%以上): 確立された原則または明確なエビデンスに基づく 中確信度(50-84%): 合理的な推論に基づくが、顕著な不確実性がある 低確信度(50%未満): 限られたエビデンス、重大な前提、または外挿に基づく
低確信度の項目には明示的に述べること:
- この主張が正しいために何が真でなければならないか
- どんな追加情報で確信度が上がるか
- この主張が間違っていた場合のリスク」
「市場規模は200億円」とだけ言うより、「確信度:低(40%)。根拠:米国市場データからの人口調整による外挿」と言うほうが遥かに有用。
パターン4:自己修復シーケンス
品質問題のある出力を体系的に診断・修正する。
ステップ1——問題の特定:
「以下の出力に品質問題がある。何が問題かを診断して。具体的に:問題は何か?推論のどこで崩れているか?原因は何か?」
ステップ2——修正の設計:
「診断に基づき、この出力を修正するための具体的な変更点は?何を追加し、何を修正し、どんな構造変更が必要か?まだ変更は加えないで——修正計画だけ。」
ステップ3——修正の実行:
「修正計画を実行して。元の出力の修正版を、特定したすべての修正を反映して作成。何が変わったか、なぜ変わったかを明示して。」
「直して」と言うより、3ステップ(診断→計画→修正)のほうが良い結果を出す。問題を理解してから解決を試みるため。
パターン5:マルチパスリファインメント
重要な出力には、異なるレンズで複数の検証パスを実行する。
レンズ1——正確性: 事実の正確性を確認。すべての主張、数値、参照をチェック。
レンズ2——論理性: 論理的厳密性を確認。すべての推論、結論、因果主張の妥当性。
レンズ3——完全性: 完全性を確認。欠落した視点、反論、シナリオはないか。
統合: 3つのレビューの指摘をすべて反映した最終版を作成。
いつ自己修正を使うか/使わないか
使う場面:
- 複雑で分析的なタスク(戦略、リサーチ、技術設計)
- エラーのコストが高い(財務分析、法的レビュー、医療情報)
- 出力が人間のレビューなしに直接使われる
- 信頼性がスピードより重要
使わない場面:
- 単純で事実に基づくタスク(テキストのフォーマット、簡単な計算)
- エラーのコストが低い(ブレインストーミング、カジュアルな文章)
- 自分でレビューする予定の出力(編集前提のドラフト)
- スピードが完璧さより重要
Key Takeaways
- 生成→検証が創造と批評を分離し、1パス生成が見逃すエラーを捕捉する
- 悪魔の代弁者が反対論を展開して結論をストレステストする
- 確信度キャリブレーションで「AIがXと言った」が「AIはXに40%の確信」に変わる
- 自己修復シーケンスは問題を診断してから修正し、より良い結果を出す
- 自己修正にはオーバーヘッドがある——複雑で重要なタスクに使う
Up Next
レッスン5:メタプロンプティングと再帰的改善——AIにプロンプトを改善させ、推論プロセスを最適化させ、出力を再帰的に向上させる手法を学ぶ。
理解度チェック
まず上のクイズを完了してください
レッスン完了!