使用Claude、Supabase和Postgres构建知识驱动的聊天机器人

## 工作流概述

这个n8n工作流演示了如何构建一个基于RAG（检索增强生成）技术的知识驱动聊天机器人，专门用于回答IPL板球规则相关问题。工作流分为两个主要步骤：

### 步骤1：向量存储创建

**1.1 手动触发** → HTTP请求下载IPL”比赛条件”PDF文档

**1.2 默认数据加载器** 从PDF中提取文本内容
– 数据类型为二进制

**1.3 递归字符文本分割器** 将文本分割成重叠的块
– 确保向量存储中的数据块有一定重叠，减少幻觉现象
– 通过块大小和块重叠两个变量进行管理

**1.4 Google Gemini嵌入** 将每个文本块转换为向量
– 需要Google Gemini API密钥
– 注意嵌入模型选择，步骤2需要使用相同的模型

**1.5 简单向量存储1** 将向量插入内存存储
– 注意向量存储名称，步骤2需要使用相同的存储

**注意**：需要Google Gemini API密钥凭证

### 步骤2：聊天机器人接口

**2.1 聊天触发器** 启动n8n原生聊天界面

**2.2 简单内存** 保留最近20个聊天轮次作为上下文
– 可在节点内编辑此值

**2.3 简单向量存储（检索工具模式）** 接收用户查询嵌入
– 在步骤1存储的向量中找到最相关的10个块
– 作为工具输出提供，驱动RAG功能
– 向量存储名称必须与步骤1匹配，嵌入规则必须一致

**2.4 Google Gemini聊天模型** 作为语言模型使用

**2.5 AI代理** 协调所有组件：
– 使用系统提示（”你是板球专家…如果信息缺失，说’抱歉我不知道'”）
– 有权访问内存（2.2）和RAG工具（2.3）
– 使用Google Gemini生成最终响应，严格限于检索到的IPL板球规则数据

## 技术要点

– 使用n8n提供的向量存储节点是测试工作流的理想方式
– 使用简单内存存储节点便于入门测试
– 需要Google Gemini API密钥凭证
– 工作流实现了完整的RAG架构，确保回答的准确性

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

评论(0)