专栏:大模型应用开发:从原理到生产
篇号:23
内容标签:RAG、检索召回、文本分块、Rerank、AI应用开发

上一篇我们写了一个最小可用 RAG 系统。
它能跑通文档加载、分块、Embedding、向量入库、Top-K 检索和基于资料回答。
到这里,很多人会有一个期待:
既然已经把资料接进来了,模型应该就能答准了吧?
现实通常没这么顺。
你会很快遇到一些让人抓头发的问题:
- 文档里明明有答案,系统就是找不到。
- 检索结果看起来相关,但回答还是偏了。
- 正确资料召回了,却排在很后面。
- 模型拿到了资料,却没有用关键那句。
- 回答看起来很流畅,但里面有资料没有写过的内容。
- 同一个问题,有时答对,有时答错。
这时最危险的反应,是直接去怪模型。
“是不是模型不够强?”
“是不是 Prompt 写得不够好?”
“是不是该换一个向量库?”
这些都有可能。
但在动手改之前,你要先定位问题。
RAG 的失败不是一种问题。
它是一条链路上不同环节的症状。
这篇就专门讲:RAG 为什么答不准,以及怎么把问题拆开查。
订阅专栏 解锁全文
412

被折叠的 条评论
为什么被折叠?



