
## 工作流概述
这是一个完整的RAG(检索增强生成)管道教程工作流,用于构建一个专门针对n8n官方文档的AI专家聊天机器人。工作流分为两个主要部分:
### 第一部分:知识库构建(图书馆建设)
这是一个一次性手动运行的过程,工作流会自动抓取n8n文档的所有页面,将其分解为小块,并使用AI模型为每个块创建特殊的数值表示(嵌入向量)。这些嵌入向量存储在n8n内置的简单向量存储中。
**重要提示**:这个内存中的知识库是临时的。如果重启n8n实例,它将被清除,需要重新运行索引过程。
### 第二部分:AI代理(专家图书管理员)
这是聊天界面。当您提问时,AI代理不会猜测答案,而是使用您的问题从刚刚构建的知识库中找到最相关的”索引卡”(块)。然后将这些特定的相关块提供给强大的语言模型(Gemini),并附带严格指令:”仅使用此信息回答用户的问题”。这确保了答案准确、真实且基于您提供的文档。
## 设置步骤
**设置时间**:约2分钟(加上15-20分钟的索引时间)
### 1. 配置Google AI凭据
– 您需要Google AI API密钥用于Gemini模型
– 在n8n工作流中,转到任意Gemini节点
– 点击凭据下拉菜单并选择”+创建新凭据”
– 输入您的Gemini API密钥并保存
### 2. 向所有节点应用凭据
– 您的新Google AI凭据现已保存
– 转到其他两个Gemini节点并选择新创建的凭据
### 3. 构建知识库
– 找到工作流左上角的”开始索引”手动触发节点
– 点击其”执行工作流”按钮开始索引过程
– **注意**:这需要15-20分钟,因为它会抓取并处理整个n8n文档
### 4. 与专家代理聊天
– 索引完成后,使用屏幕顶部的切换开关激活整个工作流
– 打开RAG聊天机器人聊天触发节点并复制其公共URL
– 在新标签页中打开URL并开始询问有关n8n的问题
## 技术架构
### 索引流程节点
– HTTP Request:获取n8n文档链接
– HTML:从HTML提取链接
– Split Out:将链接拆分为单独项目
– Remove Duplicates:删除重复链接
– Filter:仅保留文档路径
– Split In Batches:批量处理文档页面
– Execute Workflow:为每个页面调用子工作流
### 文档处理节点
– HTTP Request:获取单个页面内容
– HTML:提取文档内容
– Set:清理文档格式
– Remove Duplicates:避免重复处理
– Recursive Character Text Splitter:将文本分解为块
– Embeddings Google Gemini:创建嵌入向量
– Vector Store In Memory:存储到向量数据库
### 聊天流程节点
– Chat Trigger:聊天界面
– Agent:AI代理协调器
– Language Model Google Gemini:语言模型
– Memory Buffer Window:对话记忆
– Vector Store In Memory:检索工具
## 工作流特点
– **准确性保证**:仅基于提供的文档回答问题,避免幻觉
– **内存管理**:使用子工作流处理大量页面,避免内存溢出
– **去重机制**:智能避免重复处理相同内容
– **实时交互**:提供公共聊天URL,支持多用户访问
– **易于扩展**:可轻松替换为其他知识源
## 应用场景
– 企业内部知识问答系统
– 技术文档智能助手
– 客户支持自动化
– 教育培训工具
– 产品文档查询系统

评论(0)