从 RAG 应用中你能学到什么？ (ReRank-重排序)

在上篇文章中，讲到了文本 text-embedding 相关模型的原理，在RAG 中选择具体模型需要思考的相关因素等，这篇文章进入到RAG 的下一个阶段——ReRank 重排序；严格来讲，我们漏掉了embedding 向量数据库选型，在向量数据库选型这块，一般需要思考元数据过滤、分布式部署、高性能检索等问题，在这里不做过多阐述，本篇文章着重讲解检索之后的重排. 主要聚焦如下几个问题，为什么要ReRank？ReRank model 型有哪些？ReRank 模型原理介绍。

1.为什么要ReRank

从 RAG 应用中你能学到什么？ (ReRank-重排序)

为什么需要ReRank

上面例子可以看到，由于自然语言的复杂性，基于前面text-embedding 得到的embedding 向量，可能并不是问题Query 的答案；虽然高度类似但是却和Query 不相关；即某种程度上，类似性不等于相关性。所以这时候需要一个ReRank 模型，将召回的低质量内容给过滤掉，给正确的答案腾挪空间；实际如果召回200个doc，经过ReRank 可能只选择10个左右的doc输入大模型；一些低质量模型被过滤掉，高相关性Doc 排名提升，更容易得到准确答案。

从 RAG 应用中你能学到什么？ (ReRank-重排序)

Cross-Encoder ReRank

2.ReRank 模型

国内最火的ReRank 模型有BAAI/bge-reranker-large 、BAAI/bge-reranker-v2-m3、
BAAI/bge-reranker-v2-gemma ，这三款模型底层分别基于xlm-roberta，bge-m3，gemma-2 构建，并且这些模型都是开源，可以实现私有化部署。

国外ReRank 模型有cohere-rerank-v3.5，jina-reranker-v2-base 等，但只提供API 调用。在思考免费、私有化部署、性能等因素，bge-reranker-large 是一个较好的选择。

3.ReRank model 的相关原理

一般 ReRank model 的架构和前篇文章介绍的embedding 模型均采用类似 bert 结构，并且往往是在embedding 模型的基础上再做一些微调。Reranker model 使用问题和答案作为输入，直接输出类似度而不是embedding。重排序器是基于交叉熵损失进行微调优化的。数据格式和Embedding 一样，query、pos、neg，使用Cross Encoder 结构进行训练。

从 RAG 应用中你能学到什么？ (ReRank-重排序)