AIに質問したとき、あらかじめ持っている知識だけでなく、外部の情報を検索してから答えてくれたら便利です。その仕組みが「RAG(検索拡張生成)」です。この記事では、初心者の方に向けてRAGの仕組みをわかりやすく解説します。
RAG(検索拡張生成)とは?
RAGとは、AIが回答を作る前に外部の情報を検索し、その情報をもとに回答を生成する仕組みのことです。「検索してから生成する」という流れから、検索拡張生成と呼ばれます。
RAGが注目されている理由
通常のAIは学習済みの知識の範囲でしか答えられず、古い情報や誤った情報を出してしまうことがあります。RAGを使うと、最新の資料や社内文書などを参照しながら答えられるため、ハルシネーション対策としても期待されています。
RAGの仕組み
RAGでは、まず質問に関連する情報をデータベースや文書から検索します。次に、見つけた情報をAIに渡し、その内容をもとに回答を作らせます。この検索の部分では、意味の近さを扱うエンベディングが使われることがよくあります。
RAGの具体例
たとえば、社内のマニュアルを読み込んだ上で質問に答えるサポートチャットや、製品マニュアルを参照して使い方を案内するAIなどがあります。手元の資料に基づいた回答が欲しい場面で役立ちます。
RAGと似た用語との違い
ファインチューニングはモデル自体を追加データで調整する方法ですが、RAGはモデルはそのままに、外部の情報を検索して参照させる点が異なります。情報の更新がしやすい点がRAGの特徴です。
RAGを理解するメリット
RAGを知っておくと、AIに最新情報や社内情報を反映させる方法がイメージしやすくなります。ハルシネーションへの対策を考える上でも役立ちます。
RAGの注意点
RAGはハルシネーション対策として期待されますが、完全に防げるわけではありません。参照する情報が誤っていたり、検索がうまくいかなかったりすると、回答も不正確になるため、重要な内容は確認することが大切です。
RAGに関連する用語
RAGを理解する上では、エンベディングやハルシネーション、ファインチューニングといった言葉も一緒に覚えておくと理解が深まります。
まとめ
RAGは、外部の情報を検索し、その情報をもとにAIが回答を生成する仕組みです。ハルシネーション対策として期待されますが、完全に防げるわけではないため、確認を組み合わせて活用することが大切です。
よくある質問
RAGを使えばハルシネーションは完全に防げますか?
完全には防げません。RAGは外部の情報を参照して回答するため誤りを減らしやすいですが、参照する情報が誤っていたり検索がうまくいかなかったりすると、回答も不正確になります。重要な内容は確認しましょう。
RAGとファインチューニングはどちらが良いですか?
目的によって異なります。最新情報や頻繁に更新される情報を扱いたい場合はRAGが向き、特定の口調や専門的な振る舞いを身につけさせたい場合はファインチューニングが向いています。両者を組み合わせることもあります。
RAGを使うには何が必要ですか?
参照させたい資料や文書と、それを検索できる仕組みが必要です。最近ではRAGを簡単に試せるツールやサービスも増えており、以前より取り入れやすくなっています。

