ZPY博客

RAG是什么意思?检索增强生成通俗讲解

RAG是什么意思?检索增强生成通俗讲解

现在做大模型应用经常说RAG,很多朋友问:**RAG到底是什么意思?通俗讲到底是干嘛的?**

今天给你讲明白。

---

RAG是什么?一句话说清楚

**RAG 就是 Retrieval-Augmented Generation,翻译过来就是**检索增强生成**。

通俗说就是:**让大模型先去你的知识库搜相关资料,然后再根据资料回答你,这样回答更准更不容易瞎编**。

---

为什么需要RAG?大模型不是什么都知道吗?

大模型有两个问题:

1. **会瞎编(幻觉)** —— 大模型有时候会编一些不存在的东西,一本正经的胡说八道
2. **知识过时** —— 大模型训练数据截止到某个时间,不知道最新的事情
3. **私有数据不知道** —— 你公司内部资料,大模型训练的时候没见过,当然不知道

RAG就是解决这些问题的。

---

RAG工作流程,通俗说就是四步:

1. **你问大模型一个问题**
2. **RAG先去你的私有知识库/文档里搜**,找出和你问题相关的内容
3. **把搜出来的资料和你的问题一起给大模型**
4. **大模型根据资料给你回答**,这样回答就是基于你给的资料,不容易瞎编,也有最新信息

---

举个例子你就懂了

你有一个公司内部知识库,现在你问AI:"我们公司年假怎么规定的?"

• **不用RAG**:大模型不知道你们公司规定,可能瞎编一个,错了
• **用RAG**:先去你公司员工手册搜,找到年假规定那一段,把内容给大模型,大模型整理一下回答你,就是对的

就这么简单。

---

RAG和微调哪个好?

| 对比 | RAG | 微调 |
|------|-----|------|
| 知识更新 | 容易,换资料就行,重新检索就行 | 需要重新微调,麻烦 |
| 成本 | 便宜,不需要重新训练 | 贵一些,需要训练 |
| 减少幻觉 | 很好,回答基于给定资料 | 有帮助,但不如RAG直接 |
| 适合场景 | 私有知识库、问答、最新知识 | 改模型风格、特定任务能力 |

很多时候,可以两个一起用,效果更好。

---

总结

一句话:**RAG就是让大模型回答你问题之前,先去你的资料里搜一搜相关内容,再结合资料回答,这样回答更准,更少瞎编,还能用到你自己的私有数据**。

就是这样,解决大模型瞎编和知识过时问题,非常实用,现在做大模型应用都常用它。

---

*本文仅供学习参考*

标签:RAG RAG是什么 检索增强生成 AI名词解释 大语言模型