RAGは、外部文書やデータベースから関連情報を検索し、その結果をAIに渡して回答させる仕組みです。
Retrieval-Augmented Generation の略で、日本語では検索拡張生成と呼ばれることもあります。
まず押さえたいポイント
- AIに外部知識をその場で渡す仕組み
- 社内文書、FAQ、マニュアル、仕様書検索と相性がよい
- 取得した文書はAIのコンテキストとして使われる
- 検索結果がズレると、自然な誤回答につながる
どんな場面で使うか
RAGは、社内ナレッジ検索、問い合わせ対応、規程確認、製品マニュアル検索、技術文書のQ&Aなどで使われます。
AIモデルにすべてを学習させ直すのではなく、質問のたびに関連文書を探し、その抜粋をAIに渡して回答させます。
たとえば「有給休暇の申請期限は?」と聞かれたら、就業規則や社内マニュアルから該当箇所を検索し、その文章をコンテキストとしてAIに渡します。
AIはその文書を根拠に、利用者向けの回答を作ります。
よくある誤解
RAGを入れればAIが必ず正確になるわけではありません。
検索対象の文書が古い、検索結果が質問とズレている、権限外の文書が混ざっている、根拠を確認しないまま回答する、といった問題が起きます。
また、RAGは記憶そのものではありません。
必要な情報を検索して、その回のコンテキストへ入れる仕組みです。検索できない情報や権限上見えない情報は、回答に使えません。
実務で見るポイント
RAGを作るときは、検索精度、文書の更新日、権限管理、根拠表示、ログ管理を確認します。
特に社内文書では、部署限定の情報や個人情報が含まれることがあるため、検索結果をAIへ渡す前にアクセス権を守る設計が必要です。
AIのコンテキストとの関係で見ると、RAGは「コンテキストを自動で集める仕組み」です。
詳しい関係は、AIのコンテキストとは?プロンプト・会話履歴・RAGとの違いを整理でも説明しています。