
这是一个基于n8n的Uyarlanabilir RAG(Adaptive Retrieval Augmented Generation)工作流,实现了智能查询分类和自适应检索策略。该工作流能够根据用户查询的类型自动选择最适合的检索和生成策略,从Qdrant向量数据库中获取相关信息并提供精准回答。
工作流工作原理:
1. 输入触发:支持通过内置聊天界面或其他n8n工作流触发,需要提供用户查询、聊天记忆键和向量存储ID。
2. 查询分类:使用Google Gemini代理分析用户查询,将其分类为四种类型之一:
– 事实性查询:寻求具体、可验证的信息
– 分析性查询:需要全面分析或解释
– 观点性查询:关于主观问题或寻求不同观点
– 上下文性查询:依赖用户特定或隐含上下文
3. 自适应策略路由:根据分类结果,工作流将采用不同的检索策略:
– 事实性策略:专注于精确性,重新表述查询以更好地检索关键实体
– 分析性策略:将主查询分解为多个子问题,确保全面覆盖
– 观点性策略:识别与查询相关的不同潜在观点或方法
– 上下文性策略:推断回答查询所需的隐含上下文
4. 文档检索:使用适配后的查询/输出在指定的Qdrant集合中搜索,使用Google Gemini嵌入检索最相关的文档片段。
5. 响应生成:最终的回答代理使用定制的系统提示、检索到的文档上下文、原始用户查询和共享的聊天历史来生成响应。
该工作流特别适用于需要根据查询类型提供不同回答策略的智能助手应用,能够显著提升回答的相关性和准确性。

评论(0)