
这个n8n工作流用于从Google Drive自动加载文档到PostgreSQL向量数据库,构建自己的Qdrant向量存储MCP服务器。
**工作流程概述:**
1. **文档搜索与获取**:通过Google Drive节点搜索指定文件夹中的文件,支持PDF、文本和JSON格式
2. **文件类型分类**:使用Switch节点根据MIME类型自动分类文件
3. **内容提取**:分别处理PDF、文本和JSON文件,提取其中的内容
4. **文本处理**:使用递归字符文本分割器将长文档分割成适合嵌入的小块
5. **向量嵌入**:通过OpenAI Embeddings生成文本向量
6. **向量存储**:将向量化后的文档存储到PostgreSQL PGVector数据库中
7. **文件管理**:处理完成后将文件移动到指定文件夹
**主要功能:**
– 自动从Google Drive批量处理文档
– 支持多种文件格式(PDF、文本、JSON)
– 智能文本分割和向量化
– 集成PostgreSQL PGVector存储
– 定时触发和手动测试两种运行模式
**适用场景:**
– 构建文档检索系统
– 创建知识库向量索引
– 文档相似性搜索
– AI应用的数据预处理
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

评论(0)