
## 概述
这个n8n工作流从Google Sheets中获取航空公司在线值机URL,抓取网页内容,使用大型语言模型(LLM)生成结构化JSON数据,更新表格,创建嵌入向量,并将其存储在PostgreSQL向量数据库中,用于未来的语义搜索或问答系统。
## 快速说明
– 确保Google Sheets包含准确的URL用于抓取
– 确认PostgreSQL向量数据库已正确设置用于嵌入向量存储
## 处理流程
1. 通过Chat Trigger – Start节点启动工作流
2. 使用Fetch Airline URLs节点获取航空公司值机URL
3. 通过Scrape Airline Webpage节点抓取网页数据
4. 使用Extract info with LLM节点和Chat Model提取JSON数据
5. 通过Wait for Response节点等待响应
6. 使用Store Extracted Data节点更新Google Sheets
7. 通过Generate Embeddings节点创建嵌入向量,并使用Save to Vector DB节点存储在PostgreSQL向量数据库中
8. 使用Split Long Text节点拆分长文本,通过Wait Before Next Batch节点延迟下一批次处理
## 开始使用
1. 将工作流导入n8n并设置Google Sheets和PostgreSQL向量数据库凭据
2. 使用示例URL运行测试以确认抓取和嵌入向量存储功能
## 定制调整
– 调整Extract info with LLM节点以修改JSON输出
– 修改Fetch Airline URLs节点以从不同的表格字段拉取数据

评论(0)