
## 工作流概述
这个n8n工作流演示了如何构建一个基于RAG(检索增强生成)技术的知识驱动聊天机器人,专门用于回答IPL板球规则相关问题。工作流分为两个主要步骤:
### 步骤1:向量存储创建
**1.1 手动触发** → HTTP请求下载IPL”比赛条件”PDF文档
**1.2 默认数据加载器** 从PDF中提取文本内容
– 数据类型为二进制
**1.3 递归字符文本分割器** 将文本分割成重叠的块
– 确保向量存储中的数据块有一定重叠,减少幻觉现象
– 通过块大小和块重叠两个变量进行管理
**1.4 Google Gemini嵌入** 将每个文本块转换为向量
– 需要Google Gemini API密钥
– 注意嵌入模型选择,步骤2需要使用相同的模型
**1.5 简单向量存储1** 将向量插入内存存储
– 注意向量存储名称,步骤2需要使用相同的存储
**注意**:需要Google Gemini API密钥凭证
### 步骤2:聊天机器人接口
**2.1 聊天触发器** 启动n8n原生聊天界面
**2.2 简单内存** 保留最近20个聊天轮次作为上下文
– 可在节点内编辑此值
**2.3 简单向量存储(检索工具模式)** 接收用户查询嵌入
– 在步骤1存储的向量中找到最相关的10个块
– 作为工具输出提供,驱动RAG功能
– 向量存储名称必须与步骤1匹配,嵌入规则必须一致
**2.4 Google Gemini聊天模型** 作为语言模型使用
**2.5 AI代理** 协调所有组件:
– 使用系统提示(”你是板球专家…如果信息缺失,说’抱歉我不知道'”)
– 有权访问内存(2.2)和RAG工具(2.3)
– 使用Google Gemini生成最终响应,严格限于检索到的IPL板球规则数据
## 技术要点
– 使用n8n提供的向量存储节点是测试工作流的理想方式
– 使用简单内存存储节点便于入门测试
– 需要Google Gemini API密钥凭证
– 工作流实现了完整的RAG架构,确保回答的准确性

评论(0)