
## 工作流概述
这个n8n工作流实现了一个智能的Telegram机器人系统,能够处理文档上传、自动问答和文件管理功能。工作流名为”Mookie”,是一个基于检索增强生成(RAG)的AI助手。
## 核心功能
### 1. 文档自动摄取系统
– **Google Drive集成**:自动监控指定文件夹,批量处理新上传的PDF文件
– **手动触发**:通过”Run Ingestion”节点手动启动文档处理流程
– **Telegram文件上传**:支持通过Telegram直接上传PDF文档进行处理
### 2. 智能问答系统
– **双通道聊天**:同时支持Telegram聊天和Canvas网页聊天界面
– **RAG架构**:基于向量数据库的检索增强生成,确保回答准确性
– **记忆功能**:使用内存缓冲区保持对话上下文
### 3. 技术架构
– **向量存储**:使用PostgreSQL + PGVector扩展存储文档向量
– **AI模型**:Azure OpenAI GPT-4模型提供语言处理能力
– **嵌入模型**:Mistral Cloud处理文本嵌入
– **文档处理**:支持PDF文档的自动解析和分块处理
## 工作流程
### 文档摄取流程
1. **触发**:Google Drive文件夹监控或Telegram文件上传
2. **下载**:从Google Drive或Telegram下载PDF文件
3. **解析**:使用PDF加载器解析文档内容
4. **分块**:Token Splitter将文档分割为800字符的块
5. **嵌入**:Mistral Cloud生成文本嵌入向量
6. **存储**:将向量化文档存入PostgreSQL向量数据库
### 问答流程
1. **接收问题**:通过Telegram或Canvas聊天界面
2. **向量检索**:从向量数据库检索相关文档片段
3. **AI处理**:使用GPT-4基于检索内容生成回答
4. **返回结果**:将回答发送回用户
## 配置要求
### 必需凭证
– Azure OpenAI API:用于GPT-4语言模型
– Mistral Cloud API:用于文本嵌入
– PostgreSQL数据库:需要PGVector扩展
– Google Drive OAuth2:用于自动文档摄取
– Telegram Bot API:用于聊天界面
### 关键设置
– **分块大小**:800字符,重叠80字符
– **检索数量**:TopK=5个相关文档片段
– **温度设置**:0.1,确保回答准确性
– **系统提示**:严格基于向量存储内容回答
## 应用场景
– **企业知识库**:自动摄取公司文档,提供智能问答服务
– **客户支持**:基于产品文档提供准确的技术支持
– **教育培训**:基于学习材料提供个性化学习助手
– **文档管理**:自动整理和分析大量PDF文档
## 优势特点
– **多源输入**:支持Google Drive和Telegram两种文档上传方式
– **智能拒绝**:对于无关问题会礼貌拒绝回答
– **自动审批**:Telegram文件上传需要用户确认处理
– **批量处理**:支持Google Drive文件夹的批量文档处理
– **双界面**:同时提供Telegram和网页聊天体验

评论(0)