
这是一个基于n8n构建的增强检索生成(RAG)聊天机器人,让用户可以通过Telegram提问并从上传的PDF文档中获得准确答案。该系统使用OpenAI进行文档嵌入,并将文档备份到Google Drive。
## 👤 适用人群
完美适用于:
– 需要即时访问私有文档的知识工作者
– 需要可搜索SOP和指南的支持团队
– 为学生提供课程材料问答的教育工作者
– 自动化个人文档搜索和云备份的个人用户
## ⚙️ 工作原理
### 💬 Telegram聊天处理
1. **用户发送消息**
通过Telegram机器人触发工作流,检查消息是否为文本
2. **文本消息 → OpenAI RAG代理**
如果是文本消息,将其传递给GPT驱动的文档代理
该代理:
– 使用语义搜索从嵌入文档中检索相关信息
– 返回基于上下文的答案给用户
3. **发送回复**
机器人将生成的响应发送回Telegram用户
4. **非文本输入处理**
如果消息不是文本,机器人回复礼貌的不支持消息
### 📄 PDF上传和嵌入
1. **用户手动上传PDF**
手动触发器启动嵌入流程
2. **默认数据加载器**
读取并将PDF分割成文本片段
3. **插入向量存储(嵌入)**
使用OpenAI将文本片段嵌入并保存以供检索
4. **备份到Google Drive**
将原始PDF上传到Google Drive进行安全保存
## 🛠️ 设置指南
1. **Telegram机器人**
– 通过BotFather创建
– 连接到Telegram Trigger节点
2. **OpenAI**
– 使用您的OpenAI API密钥
– 连接Embeddings和Chat Model节点(GPT-3.5/4)
– 确保嵌入和查询使用相同的Embedding节点
3. **Google Drive**
– 在n8n中为您的Google账户设置凭据
– 连接“Backup to Google Drive”节点
4. **PDF摄取**
– 使用“Upload your PDF here”触发器
– 将其连接到加载器、嵌入器和备份流程
## ✅ 系统要求
– Telegram机器人令牌
– OpenAI API密钥(GPT + Embeddings)
– n8n实例(自托管或云端)
– Google Drive集成
– 要上传的PDF文件
## 🧩 自定义选项
| 功能 | 自定义方法 |
|——|————|
| 从文件夹自动摄取 | 为新的PDF添加Google Drive/Dropbox监视器 |
| 通过Telegram添加文件上传 | 扩展Telegram机器人以接收PDF并运行嵌入流程 |
| 跟踪用户问题 | 将Telegram用户名和问题记录到数据库 |
| 文档摘要 | 在上传时添加摘要步骤 |
| 添加Markdown或HTML支持 | 格式化回复以获得更好的Telegram渲染效果 |

评论(0)