
## 工作流概述
这个n8n工作流自动化创建和管理一个检索增强生成(RAG)系统,使用Qdrant作为向量存储,Google Drive作为文档源。它支持对Qdrant向量数据库中的文档进行完整或增量更新,并集成了使用Google Gemini的聊天机器人进行问答。
## 核心功能
### 1. 高效的RAG设置
无缝集成OpenAI、Qdrant和Google Drive,创建可扩展的RAG管道。
### 2. 单文件更新功能
可以替换单个文件的向量表示,而无需重新处理整个集合——非常适合保持文档的新鲜度。
### 3. 灵活的文件源
与Google Drive配合使用,允许从熟悉的界面进行文档管理和更新。
## 工作原理
该工作流包含四个主要阶段:
### 集合设置
– 创建或清空Qdrant集合以存储向量化文档
– 使用余弦距离度量和其他参数配置集合
### 文档处理
– 从指定的Google Drive文件夹检索文件
– 下载并处理每个文件(文本提取、分块和使用OpenAI进行嵌入)
– 将嵌入存储在Qdrant中进行向量搜索
### 单文件更新
– 通过引用其Google Drive ID允许更新或删除Qdrant集合中的特定文件
– 重新嵌入文件并更新向量存储
### RAG查询
– 使用聊天触发器接收用户问题
– 使用向量相似性从Qdrant检索相关文档
– 使用Google Gemini作为语言模型生成答案
## 设置步骤
### 配置Qdrant
– 在”Create collection”和”Clear collection”HTTP节点中替换QDRANTURL和COLLECTION
– 确保在凭据部分正确设置了Qdrant API凭据
### Google Drive集成
– 在”Get files”节点中指定Google Drive文件夹ID
– 确保配置了Google Drive OAuth凭据
### OpenAI和Gemini密钥
– 为嵌入添加OpenAI API凭据(在”Embeddings OpenAI”节点中使用)
– 配置Google Gemini凭据用于聊天模型
### 单文件更新
– 在”Edit Fields3″节点中设置file_id以定位特定的Google Drive文件进行更新
### 测试
– 手动触发工作流以填充Qdrant集合
– 使用聊天界面测试RAG响应
## 技术亮点
– **增量更新能力**:无需重新处理整个文档集合
– **多平台集成**:结合Google Drive、OpenAI、Qdrant和Google Gemini
– **向量搜索优化**:使用余弦距离进行高效的相似性搜索
– **文档分块处理**:支持文档智能分块和元数据管理
这个工作流特别适合需要定期更新知识库的AI应用场景,如客户服务机器人、文档检索系统等。

评论(0)