23 RAG 为什么答不准:召回、分块、排序的常见坑

专栏:大模型应用开发:从原理到生产
篇号:23
内容标签:RAG、检索召回、文本分块、Rerank、AI应用开发

请添加图片描述

上一篇我们写了一个最小可用 RAG 系统。

它能跑通文档加载、分块、Embedding、向量入库、Top-K 检索和基于资料回答。

到这里,很多人会有一个期待:

既然已经把资料接进来了,模型应该就能答准了吧?

现实通常没这么顺。

你会很快遇到一些让人抓头发的问题:

  • 文档里明明有答案,系统就是找不到。
  • 检索结果看起来相关,但回答还是偏了。
  • 正确资料召回了,却排在很后面。
  • 模型拿到了资料,却没有用关键那句。
  • 回答看起来很流畅,但里面有资料没有写过的内容。
  • 同一个问题,有时答对,有时答错。

这时最危险的反应,是直接去怪模型。

“是不是模型不够强?”

“是不是 Prompt 写得不够好?”

“是不是该换一个向量库?”

这些都有可能。

但在动手改之前,你要先定位问题。

RAG 的失败不是一种问题。

它是一条链路上不同环节的症状。

这篇就专门讲:RAG 为什么答不准,以及怎么把问题拆开查。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值