
## 工作流概述
这是一个基于n8n平台的递归混合检索增强生成(RAG)工作流,专门设计用于智能文档处理、内容检索和AI驱动的问答系统。该工作流结合了文档处理、向量存储和混合搜索技术,为教育评估和文档分析提供强大的自动化解决方案。
## 核心功能模块
### 1. 文档摄取与处理
**Google Drive Trigger** 监控新文件创建 → **Loop Over Items** 批量处理每个文件 → **File Info** 提取文件元数据(文件ID、类型、URL、名称) → **Google Drive** 下载实际文件内容 → **Switch** 根据文件类型(PDF或TEXT)路由到相应的提取器
### 2. 内容转换与分块
**Document Data** 节点处理提取的文本 → **Recursive Splitter** 将内容分解为上下文相关的块 → **Chunk Splitting** 应用智能分割,同时保留文档上下文和块之间的关系
### 3. 嵌入与存储
**Basic LLM Chain** 处理文本块 → **OpenAI Chat Model** 生成上下文理解 → **Summarize** 创建文档摘要 → **Supabase Vector Store** 保存嵌入向量和元数据 → **Embeddings OpenAI** 创建向量表示 → **Default Data Loader** 处理存储操作
### 4. 查询处理与检索
**When Clicking Execute** 触发用户查询 → **OpenAI** 处理和理解问题 → **AI Agent** 协调混合搜索(结合向量相似性和关键词匹配) → **Google Gemini Chat Model** 使用检索到的上下文生成最终响应 → **HTTP Request** 处理额外的外部数据源
## 技术特点
– **智能分块策略**:采用递归分割算法,确保内容分割的语义完整性
– **混合搜索机制**:结合向量相似性和传统关键词匹配,提高检索精度
– **多模型集成**:整合OpenAI和Google Gemini模型,发挥各自优势
– **实时处理能力**:支持Google Drive文件的实时监控和自动处理
– **教育评估专业化**:专门针对考试评分和答案评估场景优化
## 应用场景
– 教育机构的自动化考试评分系统
– 企业文档的知识库构建和智能检索
– 研究机构的文献分析和内容提取
– 法律文档的智能查询和案例分析

评论(0)