ツール使用:エージェントに能力を与える
AIエージェントに実際の能力を付与する——ウェブ検索、コード実行、ファイル処理、APIアクセス。信頼性の高いツール設計パターン。
プレミアムコースコンテンツ
このレッスンはプレミアムコースの一部です。Proにアップグレードすると、すべてのプレミアムコースとコンテンツを利用できます。
- すべてのプレミアムコースを利用
- 1,000以上のAIスキルテンプレート付き
- 毎週新しいコンテンツを追加
🔄 Quick Recall: 前回のレッスンで最初のリサーチエージェントを構築した。でもあのエージェントはAIモデルが既に知っていることに限定されていた。ここからエージェントに本物の能力を与える——外の世界と相互作用するツール。
ツールがエージェントを変える
ツールなしのエージェントは、知識豊富だが手足のない脳。ツールありのエージェントは、知識を行動に変えられる存在。
具体的に何が変わるか:
| ツールなし | ツールあり |
|---|---|
| 既知の情報で回答 | 最新情報を検索して回答 |
| 計算ミスする可能性 | コードで正確に計算 |
| ファイルの内容を推測 | 実際にファイルを読み取り |
| 外部サービスを説明だけ | APIで実際に操作 |
ツールの設計パターン
1. ツール定義のテンプレート
各ツールに必要な情報:
このエージェント用のツール定義を作成して。
エージェントのタスク:[何をするエージェントか]
必要なツール:[大まかなリスト]
各ツールについて以下を定義:
- 名前:簡潔で分かりやすい名前
- 説明:何をするか、いつ使うべきか
- 入力パラメータ:必須/任意、型、制約
- 出力フォーマット:何が返されるか
- エラーケース:何が失敗しうるか、その場合の対処
ツール定義はエージェントが読んで判断するもの。
人間のドキュメントではなくエージェント向けに書いて。
2. ツールチェーンの設計
複数のツールを連鎖させるのがエージェントの真骨頂:
以下のワークフローをツールチェーンとして設計して。
タスク:[マルチステップのタスクを記述]
各ステップについて:
1. 使用するツール
2. そのツールへの入力(前のステップの出力を含む)
3. 期待される出力
4. 失敗した場合のフォールバック
フロー図も作成して。
✅ Quick Check: ツールチェーンで1つのツールが失敗した場合、エージェントはどう振る舞うべき?
即座に停止ではなく、代替アプローチを試す。ウェブ検索がタイムアウトしたら別のクエリで再試行。APIがダウンしていたら別のデータソースを探す。すべての代替が失敗した場合のみ、状況を報告してユーザーに判断を仰ぐ。
3. 実用的なツールセットの例
リサーチエージェント:
- ウェブ検索(情報収集)
- ウェブページ読み取り(詳細の抽出)
- コード実行(データの整理・分析)
データ分析エージェント:
- ファイル読み取り(CSV/Excel/JSON)
- コード実行(Python/Rで統計処理)
- グラフ生成(可視化)
カスタマーサポートエージェント:
- ナレッジベース検索(社内ドキュメント)
- CRM API(顧客情報の取得)
- チケットシステムAPI(ステータス更新)
ツールの安全な使い方
読み取り専用と書き込みの区別
ツールには2つのカテゴリがある:
読み取り専用(安全) — 検索、ファイル読み取り、データ取得。何も変更しないので、誤動作のリスクが低い。
書き込み(要注意) — メール送信、データ更新、ファイル作成。実行結果を元に戻せないか、元に戻すのにコストがかかる。
原則:書き込みツールには必ず確認ステップを入れる。
エージェントのツールを安全性で分類して。
タスク:[エージェントのタスク]
ツール:[ツールリスト]
各ツールを分類:
- 読み取り専用:自由に使用OK
- 書き込み:実行前にユーザー確認が必要
- 高リスク:特別なガードレールが必要(例:決済、データ削除)
各書き込みツールについて、確認プロンプトのテンプレートも作成。
レート制限
エージェントが暴走しないよう、ツール呼び出しに上限を設ける:
- 検索ツール:1タスクあたり最大20回
- API呼び出し:1分あたり最大10回
- ファイル操作:1タスクあたり最大50回
- コスト:1タスクあたり上限を設定(例:APIコスト$5以下)
ブラウザ操作ツール
最新のAIプラットフォーム(ClaudeのComputer Use、各種フレームワーク)はブラウザを直接操作できる。
これにより可能になること:
- ウェブアプリへのログインとデータ入力
- 複数ページにわたるスクレイピング
- フォームの自動入力
- スクリーンショットの取得と視覚的確認
ただし、ブラウザ操作は他のツールより遅く、不安定になりやすい。APIやファイルアクセスで解決できるなら、そちらを優先する。
✅ Quick Check: 価格比較エージェントを構築する場合、各社のウェブサイトをブラウザでスクレイピングするのと、価格比較APIを呼び出すのでは、どちらが良い? なぜ?
APIの方が良い。速くて安定して構造化されたデータが返ってくる。ブラウザ操作はサイトのデザイン変更で壊れやすく、遅く、不安定。ブラウザは「APIが存在しない」場合の最終手段として使う。
Key Takeaways
- ツールが少ないほどエージェントの判断精度が上がる——最小限の実用的なツールセットから始める
- ツール説明はエージェントが読んで判断するもの——何をするか、いつ使うか、入出力を明確に
- ツールチェーン(複数ツールの連鎖)がエージェントの真の力を発揮させる
- 読み取りツールと書き込みツールを区別し、書き込みには確認ステップを入れる
- レート制限とコスト上限でエージェントの暴走を防ぐ
- ブラウザ操作はAPIやファイルアクセスが使えない場合の最終手段
Up Next
レッスン5:マルチステップの推論と計画では、エージェントに戦略的な思考を教える——タスク分解、計画→実行パターン、適応的な再計画。
理解度チェック
まず上のクイズを完了してください
レッスン完了!