AI大模型 RAG检索增强生成

RAG检索增强生成

发表日期：2025-03-01 12:35:06 | 来源： | | 浏览(8) 分类：AI大模型

‌基本定义‌
RAG（Retrieval-Augmented Generation）将传统信息检索系统（如向量数据库、知识图谱）与生成式大语言模型（LLM）结合。其核心原理是通过检索外部知识库中的相关信息，并将检索结果作为上下文输入给LLM，指导其生成更精准的答案‌12。

‌工作流程‌

‌检索阶段‌

：基于用户查询从大规模文档库中匹配相关段落（如使用BM25、DPR等检索模型）‌17；

‌增强阶段‌

：对检索结果进行过滤、重排或补充元数据，提升信息质量‌68；

生成阶段‌

：LLM结合检索到的上下文生成最终回答‌

RAG 常用工具分类及代表产品

一、框架与开发平台

提供文档加载、检索器集成（BM25、Chroma、FAISS等）、提示工程等全流程开发支持，支持多模态数据源接入‌35。

专注大规模数据索引与检索优化，支持树形索引、向量相似性搜索等高效检索方法，适配主流LLM‌35。

NVIDIA 推出的开源工具包，用于为对话系统添加安全防护规则，控制话题边界并提升交互可靠性‌13。

二、向量数据库

轻量级开源向量数据库，支持快速嵌入存储与相似性搜索，适合中小规模RAG应用‌35。

托管式向量数据库，提供高吞吐量检索服务，支持自动扩缩容与低延迟响应‌23。

Meta 开源的相似性搜索库，适用于大规模向量聚类与高效近邻检索‌23。

支持全文检索与向量混合搜索，适合需要结合结构化与非结构化数据的场景‌25。

三、检索模型与算法

四、嵌入模型

五、评估工具

六、其他工具