一、标准答案参考
答:在实际的RAG应用中,不能盲目地进行调优,需要根据RAG系统的各项测评得分来进行优化:如果上下文召回率得分低,先从知识库、embedding模型、query改写等部分开始优化;如果上下文准确率得分低,重点看是否存在噪音信息,通常要加rerank重排序模型; 如果答案准确率得分低,而前两项得分还不错时,那就需要去优化prompt、生成参数和大模型了。排查思路参考下图:

二、RAG效果调优详细解析
RAG的回答质量,在根本上依赖于提供给大模型的上下文,大模型不是凭空知道答案,大模型是在读给它的上下文,然后生成回答,所以上下文质量,几乎直接决定了系统上限。这里有两个很容易混在一起的问题:
一个是没有把关键知识找出来;另一个是找出来了一些东西,但无关内容太多,真正有用的信息被埋了,也就是噪音太多。
上下文噪音很多其实很常见,很多人会本能地觉得,资料给得越多越保险,反正让模型自己判断就行。但是当上下文里掺进大量无关内容时,大模型的注意力会被分散,关键内容更容易被忽略,这就是RAG里常说的Lost in the Middle。
在实际应用中,我们应该根据测评指标进行效果调优,流程见下图:

1、先看上下文召回率(context recall)得分
这个指标属于检索阶段,核心问题是:该找回来的知识,到底有没有找回来。如果得分偏低,通常建议优先查看检索链路是否存在问题,可以先从以下三个方向排查:
- 检查知识库本身
知识库如果缺内容,那后面的检索、重排、大模型生成都无从谈起。最直接的办法,就是把测试样本和知识库做一轮对照,看看每条样本是否真的有可支撑的知识来源,这个过程可以借助大模型辅助完成。
- 检查embedding模型
如果知识库存在相关知识,但相关内容就是召不回来,问题可能出在embedding能力不够,一般来说可以换更好的embedding模型,如果有领域内的专业知识,那就需要对embedding模型进行微调,这部分就是属于算法同学的工作了,一般来说不涉及开发。
- 检查query(查询)本身
其实真实的用户提问,往往并不标准,很多输入是碎片化的,不能假设用户会替系统把问题整理好。在实际应用中,需要结合常见问题设计prompt,先让模型把原始问题改写成更适合检索的形式,再送进 RAG 流程。
2、再看上下文准确率(context precision)得分
这部分还是属于检索阶段,但关注点和context recall(上下文召回率)不一样,precision是在评价“找回来的内容是不是足够相关,而且排在前面”。
准确率得分低一般来说是噪音太多,或者相关片段排名不够靠前。从结果上看,大模型虽然拿到了候选信息,但最有用的内容没有放在前面,回答就也就会变得不稳定。
这种情况下,一般来说需要加一个rerank重排序模型,就是在初步召回之后,再做一轮“谁更相关”的排序,把真正关键的内容放在前面。
3、看答案准确率(answer correctness)得分
这个指标看的是最终答案质量,如果得分偏低,同时context recall和context precision又都还不错,那就需要检查生成阶段,一般可以从以下几个内容开始检查:
- 检查prompt
例如检查大模型的prompt,到底有没有被明确要求“只基于上下文回答”、“信息不足时直接说不知道”、“不要自行补全缺失事实”。
- 检查大模型生成参数
比如temperature过高,回答就更容易发散,需要稳定性的时候,一般需要调整小一些。
- 检查大模型能力本身
有些任务对推理、约束遵循、长上下文理解要求更高,如果大模型能力弱了,就算检索做得再好,最后也可能掉链子。
- 微调大模型
微调可以作为选项提一下,因为成本很高、边界条件等一般不建议写成通用解法,而且也不是开发的工作。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

2154

被折叠的 条评论
为什么被折叠?



