高级实战场景 · 场景4

RAG 实战

面向企业知识库、私有文档助手和长代码分析场景，掌握从语料准备、检索链路设计到效果评估与持续优化的完整 RAG 落地流程，真正把 RAG 做成可迭代的工程系统。

学习目标

理解 RAG-DD 的端到端落地流程，并能把问题拆到语料、检索、生成各层验证

能够设计知识库分块、元数据、更新机制与权限边界

掌握检索、重排序、上下文组装之间的关键权衡

能够通过评估集与失败复盘持续优化 RAG 效果

问题定义：明确用户问题类型、可接受延迟、回答可信度要求，以及是否需要引用来源。

语料治理：清理文档、去重、打标签、建立更新时间和权限边界，避免把脏数据直接送进知识库。

检索设计：决定分块策略、向量检索或混合检索、是否需要重排序，以及最终注入模型的上下文结构。

评估迭代：通过命中率、召回率、答案准确率与失败样本复盘，持续优化分块、召回和 Prompt。

实践原则：先做“能解释为什么答成这样”的 RAG，再追求“看起来更聪明”的回答质量。

让 AI 从历史 FAQ、工单、文档目录中生成评估问题集，覆盖查询改写、模糊问法和长尾场景。

重点不是“让 AI 评自己”，而是让 AI 帮你快速构造覆盖面更广的测试样本。

目标：让员工用自然语言查询制度、流程、FAQ 和架构文档，并返回带出处的答案。

目标：结合代码注释、README、架构设计文档和模块边界信息，辅助开发者快速定位实现逻辑。

能够根据场景设计 RAG 的语料、分块和检索链路

理解向量检索、混合检索和重排序的适用边界

能够建立最小可用的 RAG 评估集与失败复盘机制

知道如何处理来源引用、权限隔离和知识更新问题

能把 RAG 作为工程系统而不是单次 Prompt 技巧来设计