AIエージェントは、LLM などのAIモデルを使い、目的に向けて判断しながら複数ステップの作業を進める仕組みです。
単に質問へ答えるチャットAIよりも、検索、ファイル操作、コード実行、API呼び出し、チケット更新のような外部ツール利用を含むことが多いです。
まず押さえたいポイント
- 目的に向けて、複数の手順を組み立てる
- 外部ツールやデータを使うことが多い
- 途中の結果を見て、次の行動を選ぶ
- 自律性が高いほど、評価や制御が重要になる
どんな場面で使うか
AIエージェントは、コード修正、調査、問い合わせ対応、社内ナレッジ検索、データ整理、ブラウザ操作などで使われます。
人が毎回判断していた作業の一部を、AIがツールを使いながら進めるイメージです。
ただし、何でも任せればよいわけではありません。
外部システムを操作する場合、間違った判断がデータ更新、メール送信、権限外アクセス、コスト増加につながることがあります。
チャットAIとの違い
チャットAIは、主に入力に対して回答を返します。
AIエージェントは、回答だけでなく、必要な情報を探す、ツールを呼ぶ、結果を見て次の操作を選ぶ、といった行動を含みます。
そのため、実務ではモデルの性能だけでなく、使わせるツール、権限、ログ、テスト、停止条件まで設計する必要があります。
この周辺設計は、ハーネスエンジニアリングの重要な対象になります。
実務で見るポイント
最初に確認したいのは、エージェントに何を任せ、何を任せないかです。
読み取りだけならリスクは比較的小さいですが、DB更新、決済、メール送信、公開操作のような副作用がある作業は、人間承認や強いガードレールを置いた方が安全です。
また、成功基準を曖昧にしないことも重要です。
「いい感じに調べる」ではなく、「指定した情報源から根拠URL付きで回答する」「テストが通った変更だけ提案する」のように完了条件を決めると、評価しやすくなります。