
## 项目概述
这个项目展示了如何使用n8n构建检索增强生成(RAG)系统,创建一个基于Webhook连接的文档问答系统,支持通过Lovable用户界面进行查询。
### 核心功能
🧾 **文档加载**:从Google Drive下载PDF格式文档(合同文档、用户手册、HR政策文档等)
📚 **向量化处理**:使用OpenAI将文档转换为向量嵌入
🔍 **向量存储与搜索**:在Pinecone向量数据库中存储和搜索文档
💬 **自然语言查询**:使用AI代理对合同进行自然语言查询
### 工作流结构
#### 流程1:文档加载与RAG设置
这个流程自动化:
– 从Google Drive文件夹读取文档
– 使用text-embedding-3-small进行向量化
– 将向量上传到Pinecone用于后续语义搜索
**工作流节点**:
– Manual Trigger(手动触发器)
– Google Drive Search(Google Drive搜索)
– Google Drive Download(Google Drive下载)
– Pinecone Vector Store(Pinecone向量存储)
– Default Data Loader(默认数据加载器)
– Recursive Character Text Splitter(递归字符文本分割器)
– OpenAI Embedding(OpenAI嵌入)
**详细步骤**:
1. **手动触发器**:按需启动工作流加载新文档
2. **Google Drive搜索与下载**:
– 节点:Google Drive(搜索:文件/文件夹)
– 需要凭据访问Google Drive文件夹和文件
– 从Google Drive下载PDF文档
3. **递归文本分割器**:将长文档分割为重叠块
– 设置:块大小1000,重叠100
4. **OpenAI嵌入**:
– 模型:text-embedding-3-small
– 用于创建文档向量
5. **Pinecone向量存储**:
– 索引:package1536
– 批量大小:200
– 设置:密集类型,区域us-east-1,模式:插入文档
#### 流程2:基于聊天的问答代理
这个流程支持使用带有向量记忆的OpenAI驱动代理对存储的文档进行聊天式查询。
**工作流节点**:
– Chat Trigger(聊天触发器)
– AI Agent(AI代理)
– OpenAI Chat Model(OpenAI聊天模型)
– Simple Memory(简单记忆)
– Answer with Vector Store(使用向量存储回答)
– Pinecone Vector Store(Pinecone向量存储)
– Embeddings OpenAI(OpenAI嵌入)
**组件说明**:
– **聊天触发器**:接收传入的聊天查询
– **AI代理节点**:使用以下工具处理查询流程:
– 聊天模型:OpenAI GPT
– 记忆:简单记忆
– 工具:使用向量存储回答问题
– **Pinecone向量存储**:通过与流程1相同的嵌入索引连接
– **嵌入**:确保文档块可使用向量相似性检索
– **响应节点**:通过聊天响应向用户返回最终AI响应
#### 流程3:基于UI的查询(使用Lovable)
这个流程使用通过Lovable构建的Web UI直接从表单界面查询合同。
**Webhook设置**:
– Webhook节点
– 方法:POST
– URL:您的webhook URL
– 响应:使用’Respond to Webhook’节点
**工作流逻辑**:
– Webhook(Lovable表单)→ AI代理
– AI代理 → OpenAI聊天模型
– AI代理 → 简单记忆
– AI代理 → 使用向量存储回答
– 使用向量存储回答 → Pinecone向量存储
– Pinecone向量存储 → OpenAI嵌入
– AI代理 → 响应Webhook
**Lovable UI功能**:
用户可以提交:
– 全名
– 邮箱
– 部门
– 自由格式查询:用户可以输入任何自由格式查询
数据通过webhook发送到n8n,并从合同内容中返回答案。
### 应用场景
🔍 **合同查询**:为法律/HR团队提供合同查询服务
🔍 **采购与供应商协议QA**:自动化采购和供应商协议质量保证
🔍 **客户支持自动化**:基于条款的客户支持自动化
🔍 **私有文档知识RAG系统**:为私有文档知识构建RAG系统
### 技术栈
⚙️ **工具与技术**:
– AI嵌入:OpenAI text-embedding-3-small
– 向量数据库:Pinecone
– 分块处理:递归文本分割器
– AI代理:OpenAI GPT聊天
– 自动化:n8n
– UI集成:Lovable(基于表单)
### 技术规格
📌 **最终配置**:
– Pinecone索引:package1536
– 维度:1536
– 块大小:1000,重叠:100
– 嵌入模型:text-embedding-3-small
这个工作流展示了如何构建一个完整的文档问答系统,从文档加载到用户查询的完整流程,特别适合需要处理大量合同和文档的企业环境。

评论(0)