检索增强生成（RAG）是让 AI 助手能够基于您的文档给出准确答案的核心技术。下面我们来拆解它的工作原理。

什么是 RAG？

RAG 将大型语言模型（LLM）的能力与检索系统相结合，后者会在您的文档中搜索相关信息。AI 不再仅依赖训练数据中的知识，而是能够从您的专属知识库中"查找"信息。

RAG 流水线

以下是 Kodda 实现 RAG 的方式：

当您上传文档（PDF、DOCX 等）时，我们的系统会提取文本内容，尽可能保留结构和格式。

长文档会被拆分为较小的块（通常每块 500–1000 个 token）。这有助于检索系统找到最相关的段落，并确保 LLM 获得聚焦的上下文。

每个文本块都会被转换为向量嵌入——文本语义的数值表示。语义相近的文本具有相似的向量。

这些嵌入存储在向量数据库中，按租户组织，实现完全的数据隔离。

当用户提问时，问题会被转换为嵌入，然后在向量数据库中搜索最相似的文本块。这就是语义搜索——基于语义而非关键词匹配来查找结果。

检索到的文本块连同用户问题一起传给 LLM。LLM 基于这些上下文生成回答，确保答案准确且有据可查。

准备好构建您自己的私有 AI 了吗？注册 Kodda，上传一些文档，亲身体验 RAG 的强大之处。您也可以了解如何搭建 AI 知识库，让您的 AI 助手直接从知识库中回答问题。

探索我们的 RAG 使用场景或查看定价方案开始使用。