Why Nostr? What is Njump?
GPTDAOCN-e/acc /
npub1ats…0ns2
2024-09-22 16:40:13

GPTDAOCN-e/acc on Nostr: RAG范式进化图解:从基础到模块化的全面解析 ...

RAG范式进化图解:从基础到模块化的全面解析

https://t.co/St5O59mmxt分析,这张图展示了三种RAG(Retrieval-Augmented Generation)范式的对比:Naive RAG、Advanced RAG和Modular RAG。每种范式都有不同的模块和处理流程,逐步增加了复杂性和功能。

1. Naive RAG:
- Indexing:数据索引。
- Retrieval:从索引中检索相关信息。
- Generation:根据检索到的信息生成结果。

2. Advanced RAG:
- Indexing:数据索引。
- Pre-Retrieval:在检索之前进行查询重写(Query Rewrite)或混合密度估计(HyDE)。
- Retrieval:从索引中检索信息。
- Post-Retrieval:对检索结果进行重新排序(Rerank)和过滤(Filter)。
- Generation:根据处理后的信息生成结果。

3. Modular RAG:
- Indexing:
- 进一步优化分块(Chunk Optimization),通过使用父级大块、周围上下文等方法来提升检索效率。
- 结构化组织(Structural Organization),包括PDF、知识图谱等结构层次关系。
- Pre-Retrieval:
- 查询转换(Query Transformation),如HyDE、假设答案等。
- 查询扩展(Query Expansion)和查询构建(Query Construction)。
- Retrieval:
- 使用外部知识库进行强化学习(Retriever FT)。
- 多种检索源和选择策略,包括嵌入、关键词、混合检索等。
- Post-Retrieval:
- 重新排序、多类型文档的重新排序和压缩选择等。
- Generation:
- 使用更大的语言模型进行生成,包含验证步骤以确保输出质量。

此外,Modular RAG还增加了路由(Routing)、调度(Scheduling)和知识指南(Knowledge Guide)等高级功能,以提高整体系统的灵活性和准确性。

总结来看,Modular RAG通过模块化设计与多层次优化,显著提升了RAG系统在实际应用中的性能与适应性。
Author Public Key
npub1atst8p6wc9xz0aezu7csvqxyrevrnckc2ckpt4q5gsgpthq0n0ese50ns2